ebtables: test layer2_protocols in an external chain
[pve-firewall.git] / src / PVE / Firewall.pm
1 package PVE::Firewall;
2
3 use warnings;
4 use strict;
5 use POSIX;
6 use Data::Dumper;
7 use Digest::SHA;
8 use Socket qw(AF_INET6 inet_ntop inet_pton);
9 use PVE::INotify;
10 use PVE::Exception qw(raise raise_param_exc);
11 use PVE::JSONSchema qw(register_standard_option get_standard_option);
12 use PVE::Cluster;
13 use PVE::ProcFSTools;
14 use PVE::Tools qw($IPV4RE $IPV6RE);
15 use PVE::Network;
16 use PVE::SafeSyslog;
17 use File::Basename;
18 use File::Path;
19 use IO::File;
20 use Net::IP;
21 use PVE::Tools qw(run_command lock_file dir_glob_foreach);
22 use Encode;
23 use Storable qw(dclone);
24
25 my $hostfw_conf_filename = "/etc/pve/local/host.fw";
26 my $pvefw_conf_dir = "/etc/pve/firewall";
27 my $clusterfw_conf_filename = "$pvefw_conf_dir/cluster.fw";
28
29 # dynamically include PVE::QemuServer and PVE::LXC
30 # to avoid dependency problems
31 my $have_qemu_server;
32 eval {
33     require PVE::QemuServer;
34     require PVE::QemuConfig;
35     $have_qemu_server = 1;
36 };
37
38 my $have_lxc;
39 eval {
40     require PVE::LXC;
41     $have_lxc = 1;
42 };
43
44
45 my $pve_fw_status_dir = "/var/lib/pve-firewall";
46
47 mkdir $pve_fw_status_dir; # make sure this exists
48
49 my $security_group_name_pattern = '[A-Za-z][A-Za-z0-9\-\_]+';
50 my $ipset_name_pattern = '[A-Za-z][A-Za-z0-9\-\_]+';
51 our $ip_alias_pattern = '[A-Za-z][A-Za-z0-9\-\_]+';
52
53 my $max_alias_name_length = 64;
54 my $max_ipset_name_length = 64;
55 my $max_group_name_length = 18;
56
57 my $PROTOCOLS_WITH_PORTS = {
58     udp => 1,     17 => 1,
59     udplite => 1, 136 => 1,
60     tcp => 1,     6 => 1,
61     dccp => 1,    33 => 1,
62     sctp => 1,    132 => 1,
63 };
64
65 PVE::JSONSchema::register_format('IPorCIDR', \&pve_verify_ip_or_cidr);
66 sub pve_verify_ip_or_cidr {
67     my ($cidr, $noerr) = @_;
68
69     if ($cidr =~ m!^(?:$IPV6RE|$IPV4RE)(/(\d+))?$!) {
70         return $cidr if Net::IP->new($cidr);
71         return undef if $noerr;
72         die Net::IP::Error() . "\n";
73     }
74     return undef if $noerr;
75     die "value does not look like a valid IP address or CIDR network\n";
76 }
77
78 PVE::JSONSchema::register_format('IPorCIDRorAlias', \&pve_verify_ip_or_cidr_or_alias);
79 sub pve_verify_ip_or_cidr_or_alias {
80     my ($cidr, $noerr) = @_;
81
82     return if $cidr =~ m/^(?:$ip_alias_pattern)$/;
83
84     return pve_verify_ip_or_cidr($cidr, $noerr);
85 }
86
87 PVE::JSONSchema::register_standard_option('ipset-name', {
88     description => "IP set name.",
89     type => 'string',
90     pattern => $ipset_name_pattern,
91     minLength => 2,
92     maxLength => $max_ipset_name_length,
93 });
94
95 PVE::JSONSchema::register_standard_option('pve-fw-alias', {
96     description => "Alias name.",
97     type => 'string',
98     pattern => $ip_alias_pattern,
99     minLength => 2,
100     maxLength => $max_alias_name_length,
101 });
102
103 PVE::JSONSchema::register_standard_option('pve-fw-loglevel' => {
104     description => "Log level.",
105     type => 'string',
106     enum => ['emerg', 'alert', 'crit', 'err', 'warning', 'notice', 'info', 'debug', 'nolog'],
107     optional => 1,
108 });
109
110 PVE::JSONSchema::register_standard_option('pve-security-group-name', {
111     description => "Security Group name.",
112     type => 'string',
113     pattern => $security_group_name_pattern,
114     minLength => 2,
115     maxLength => $max_group_name_length,
116 });
117
118 my $feature_ipset_nomatch = 0;
119 eval  {
120     my (undef, undef, $release) = POSIX::uname();
121     if ($release =~ m/^(\d+)\.(\d+)\.\d+-/) {
122         my ($major, $minor) = ($1, $2);
123         $feature_ipset_nomatch = 1 if ($major > 3) ||
124             ($major == 3 && $minor >= 7);
125     }
126
127 };
128
129 my $nodename = PVE::INotify::nodename();
130
131 my $pve_fw_lock_filename = "/var/lock/pvefw.lck";
132
133 my $default_log_level = 'nolog'; # avoid logs by default
134
135 my $log_level_hash = {
136     debug => 7,
137     info => 6,
138     notice => 5,
139     warning => 4,
140     err => 3,
141     crit => 2,
142     alert => 1,
143     emerg => 0,
144 };
145
146 # %rule
147 #
148 # name => optional
149 # enable => [0|1]
150 # action =>
151 # proto =>
152 # sport => port[,port[,port]].. or port:port
153 # dport => port[,port[,port]].. or port:port
154 # log => optional, loglevel
155 # logmsg => optional, logmsg - overwrites default
156 # iface_in => incomin interface
157 # iface_out => outgoing interface
158 # match => optional, overwrites generation of match
159 # target => optional, overwrites action
160
161 # we need to overwrite some macros for ipv6
162 my $pve_ipv6fw_macros = {
163     'Ping' => [
164         { action => 'PARAM', proto => 'icmpv6', dport => 'echo-request' },
165     ],
166     'NeighborDiscovery' => [
167         "IPv6 neighbor solicitation, neighbor and router advertisement",
168         { action => 'PARAM', proto => 'icmpv6', dport => 'router-solicitation' },
169         { action => 'PARAM', proto => 'icmpv6', dport => 'router-advertisement' },
170         { action => 'PARAM', proto => 'icmpv6', dport => 'neighbor-solicitation' },
171         { action => 'PARAM', proto => 'icmpv6', dport => 'neighbor-advertisement' },
172     ],
173     'DHCPv6' => [
174         "DHCPv6 traffic",
175         { action => 'PARAM', proto => 'udp', dport => '546:547', sport => '546:547' },
176     ],
177     'Trcrt' => [
178         { action => 'PARAM', proto => 'udp', dport => '33434:33524' },
179         { action => 'PARAM', proto => 'icmpv6', dport => 'echo-request' },
180     ],
181  };
182
183 # imported/converted from: /usr/share/shorewall/macro.*
184 my $pve_fw_macros = {
185     'Amanda' => [
186         "Amanda Backup",
187         { action => 'PARAM', proto => 'udp', dport => '10080' },
188         { action => 'PARAM', proto => 'tcp', dport => '10080' },
189     ],
190     'Auth' => [
191         "Auth (identd) traffic",
192         { action => 'PARAM', proto => 'tcp', dport => '113' },
193     ],
194     'BGP' => [
195         "Border Gateway Protocol traffic",
196         { action => 'PARAM', proto => 'tcp', dport => '179' },
197     ],
198     'BitTorrent' => [
199         "BitTorrent traffic for BitTorrent 3.1 and earlier",
200         { action => 'PARAM', proto => 'tcp', dport => '6881:6889' },
201         { action => 'PARAM', proto => 'udp', dport => '6881' },
202     ],
203     'BitTorrent32' => [
204         "BitTorrent traffic for BitTorrent 3.2 and later",
205         { action => 'PARAM', proto => 'tcp', dport => '6881:6999' },
206         { action => 'PARAM', proto => 'udp', dport => '6881' },
207     ],
208     'Ceph' => [
209         "Ceph Storage Cluster traffic (Ceph Monitors, OSD & MDS Deamons)",
210         { action => 'PARAM', proto => 'tcp', dport => '6789' },
211         { action => 'PARAM', proto => 'tcp', dport => '6800:7300' },
212     ],
213     'CVS' => [
214         "Concurrent Versions System pserver traffic",
215         { action => 'PARAM', proto => 'tcp', dport => '2401' },
216     ],
217     'Citrix' => [
218         "Citrix/ICA traffic (ICA, ICA Browser, CGP)",
219         { action => 'PARAM', proto => 'tcp', dport => '1494' },
220         { action => 'PARAM', proto => 'udp', dport => '1604' },
221         { action => 'PARAM', proto => 'tcp', dport => '2598' },
222     ],
223     'DAAP' => [
224         "Digital Audio Access Protocol traffic (iTunes, Rythmbox daemons)",
225         { action => 'PARAM', proto => 'tcp', dport => '3689' },
226         { action => 'PARAM', proto => 'udp', dport => '3689' },
227     ],
228     'DCC' => [
229         "Distributed Checksum Clearinghouse spam filtering mechanism",
230         { action => 'PARAM', proto => 'tcp', dport => '6277' },
231     ],
232     'DHCPfwd' => [
233         "Forwarded DHCP traffic",
234         { action => 'PARAM', proto => 'udp', dport => '67:68', sport => '67:68' },
235     ],
236     'DNS' => [
237         "Domain Name System traffic (upd and tcp)",
238         { action => 'PARAM', proto => 'udp', dport => '53' },
239         { action => 'PARAM', proto => 'tcp', dport => '53' },
240     ],
241     'Distcc' => [
242         "Distributed Compiler service",
243         { action => 'PARAM', proto => 'tcp', dport => '3632' },
244     ],
245     'FTP' => [
246         "File Transfer Protocol",
247         { action => 'PARAM', proto => 'tcp', dport => '21' },
248     ],
249     'Finger' => [
250         "Finger protocol (RFC 742)",
251         { action => 'PARAM', proto => 'tcp', dport => '79' },
252     ],
253     'GNUnet' => [
254         "GNUnet secure peer-to-peer networking traffic",
255         { action => 'PARAM', proto => 'tcp', dport => '2086' },
256         { action => 'PARAM', proto => 'udp', dport => '2086' },
257         { action => 'PARAM', proto => 'tcp', dport => '1080' },
258         { action => 'PARAM', proto => 'udp', dport => '1080' },
259     ],
260     'GRE' => [
261         "Generic Routing Encapsulation tunneling protocol",
262         { action => 'PARAM', proto => '47' },
263     ],
264     'Git' => [
265         "Git distributed revision control traffic",
266         { action => 'PARAM', proto => 'tcp', dport => '9418' },
267     ],
268     'HKP' => [
269         "OpenPGP HTTP keyserver protocol traffic",
270         { action => 'PARAM', proto => 'tcp', dport => '11371' },
271     ],
272     'HTTP' => [
273         "Hypertext Transfer Protocol (WWW)",
274         { action => 'PARAM', proto => 'tcp', dport => '80' },
275     ],
276     'HTTPS' => [
277         "Hypertext Transfer Protocol (WWW) over SSL",
278         { action => 'PARAM', proto => 'tcp', dport => '443' },
279     ],
280     'ICPV2' => [
281         "Internet Cache Protocol V2 (Squid) traffic",
282         { action => 'PARAM', proto => 'udp', dport => '3130' },
283     ],
284     'ICQ' => [
285         "AOL Instant Messenger traffic",
286         { action => 'PARAM', proto => 'tcp', dport => '5190' },
287     ],
288     'IMAP' => [
289         "Internet Message Access Protocol",
290         { action => 'PARAM', proto => 'tcp', dport => '143' },
291     ],
292     'IMAPS' => [
293         "Internet Message Access Protocol over SSL",
294         { action => 'PARAM', proto => 'tcp', dport => '993' },
295     ],
296     'IPIP' => [
297         "IPIP capsulation traffic",
298         { action => 'PARAM', proto => '94' },
299     ],
300     'IPsec' => [
301         "IPsec traffic",
302         { action => 'PARAM', proto => 'udp', dport => '500', sport => '500' },
303         { action => 'PARAM', proto => '50' },
304     ],
305     'IPsecah' => [
306         "IPsec authentication (AH) traffic",
307         { action => 'PARAM', proto => 'udp', dport => '500', sport => '500' },
308         { action => 'PARAM', proto => '51' },
309     ],
310     'IPsecnat' => [
311         "IPsec traffic and Nat-Traversal",
312         { action => 'PARAM', proto => 'udp', dport => '500' },
313         { action => 'PARAM', proto => 'udp', dport => '4500' },
314         { action => 'PARAM', proto => '50' },
315     ],
316     'IRC' => [
317         "Internet Relay Chat traffic",
318         { action => 'PARAM', proto => 'tcp', dport => '6667' },
319     ],
320     'Jetdirect' => [
321         "HP Jetdirect printing",
322         { action => 'PARAM', proto => 'tcp', dport => '9100' },
323     ],
324     'L2TP' => [
325         "Layer 2 Tunneling Protocol traffic",
326         { action => 'PARAM', proto => 'udp', dport => '1701' },
327     ],
328     'LDAP' => [
329         "Lightweight Directory Access Protocol traffic",
330         { action => 'PARAM', proto => 'tcp', dport => '389' },
331     ],
332     'LDAPS' => [
333         "Secure Lightweight Directory Access Protocol traffic",
334         { action => 'PARAM', proto => 'tcp', dport => '636' },
335     ],
336     'MSNP' => [
337         "Microsoft Notification Protocol",
338         { action => 'PARAM', proto => 'tcp', dport => '1863' },
339     ],
340     'MSSQL' => [
341         "Microsoft SQL Server",
342         { action => 'PARAM', proto => 'tcp', dport => '1433' },
343     ],
344     'Mail' => [
345         "Mail traffic (SMTP, SMTPS, Submission)",
346         { action => 'PARAM', proto => 'tcp', dport => '25' },
347         { action => 'PARAM', proto => 'tcp', dport => '465' },
348         { action => 'PARAM', proto => 'tcp', dport => '587' },
349     ],
350     'MDNS' => [
351         "Multicast DNS",
352         { action => 'PARAM', proto => 'udp', dport => '5353' },
353     ],
354     'Munin' => [
355         "Munin networked resource monitoring traffic",
356         { action => 'PARAM', proto => 'tcp', dport => '4949' },
357     ],
358     'MySQL' => [
359         "MySQL server",
360         { action => 'PARAM', proto => 'tcp', dport => '3306' },
361     ],
362     'NNTP' => [
363         "NNTP traffic (Usenet).",
364         { action => 'PARAM', proto => 'tcp', dport => '119' },
365     ],
366     'NNTPS' => [
367         "Encrypted NNTP traffic (Usenet)",
368         { action => 'PARAM', proto => 'tcp', dport => '563' },
369     ],
370     'NTP' => [
371         "Network Time Protocol (ntpd)",
372         { action => 'PARAM', proto => 'udp', dport => '123' },
373     ],
374     'OSPF' => [
375         "OSPF multicast traffic",
376         { action => 'PARAM', proto => '89' },
377     ],
378     'OpenVPN' => [
379         "OpenVPN traffic",
380         { action => 'PARAM', proto => 'udp', dport => '1194' },
381     ],
382     'PCA' => [
383         "Symantec PCAnywere (tm)",
384         { action => 'PARAM', proto => 'udp', dport => '5632' },
385         { action => 'PARAM', proto => 'tcp', dport => '5631' },
386     ],
387     'POP3' => [
388         "POP3 traffic",
389         { action => 'PARAM', proto => 'tcp', dport => '110' },
390     ],
391     'POP3S' => [
392         "Encrypted POP3 traffic",
393         { action => 'PARAM', proto => 'tcp', dport => '995' },
394     ],
395     'PPtP' => [
396         "Point-to-Point Tunneling Protocol",
397         { action => 'PARAM', proto => '47' },
398         { action => 'PARAM', proto => 'tcp', dport => '1723' },
399     ],
400     'Ping' => [
401         "ICMP echo request",
402         { action => 'PARAM', proto => 'icmp', dport => 'echo-request' },
403     ],
404     'PostgreSQL' => [
405         "PostgreSQL server",
406         { action => 'PARAM', proto => 'tcp', dport => '5432' },
407     ],
408     'Printer' => [
409         "Line Printer protocol printing",
410         { action => 'PARAM', proto => 'tcp', dport => '515' },
411     ],
412     'RDP' => [
413         "Microsoft Remote Desktop Protocol traffic",
414         { action => 'PARAM', proto => 'tcp', dport => '3389' },
415     ],
416     'RIP' => [
417         "Routing Information Protocol (bidirectional)",
418         { action => 'PARAM', proto => 'udp', dport => '520' },
419     ],
420     'RNDC' => [
421         "BIND remote management protocol",
422         { action => 'PARAM', proto => 'tcp', dport => '953' },
423     ],
424     'Razor' => [
425         "Razor Antispam System",
426         { action => 'ACCEPT', proto => 'tcp', dport => '2703' },
427     ],
428     'Rdate' => [
429         "Remote time retrieval (rdate)",
430         { action => 'PARAM', proto => 'tcp', dport => '37' },
431     ],
432     'Rsync' => [
433         "Rsync server",
434         { action => 'PARAM', proto => 'tcp', dport => '873' },
435     ],
436     'SANE' => [
437         "SANE network scanning",
438         { action => 'PARAM', proto => 'tcp', dport => '6566' },
439     ],
440     'SMB' => [
441         "Microsoft SMB traffic",
442         { action => 'PARAM', proto => 'udp', dport => '135,445' },
443         { action => 'PARAM', proto => 'udp', dport => '137:139' },
444         { action => 'PARAM', proto => 'udp', dport => '1024:65535', sport => '137' },
445         { action => 'PARAM', proto => 'tcp', dport => '135,139,445' },
446     ],
447     'SMBswat' => [
448         "Samba Web Administration Tool",
449         { action => 'PARAM', proto => 'tcp', dport => '901' },
450     ],
451     'SMTP' => [
452         "Simple Mail Transfer Protocol",
453         { action => 'PARAM', proto => 'tcp', dport => '25' },
454     ],
455     'SMTPS' => [
456         "Encrypted Simple Mail Transfer Protocol",
457         { action => 'PARAM', proto => 'tcp', dport => '465' },
458     ],
459     'SNMP' => [
460         "Simple Network Management Protocol",
461         { action => 'PARAM', proto => 'udp', dport => '161:162' },
462         { action => 'PARAM', proto => 'tcp', dport => '161' },
463     ],
464     'SPAMD' => [
465         "Spam Assassin SPAMD traffic",
466         { action => 'PARAM', proto => 'tcp', dport => '783' },
467     ],
468     'SSH' => [
469         "Secure shell traffic",
470         { action => 'PARAM', proto => 'tcp', dport => '22' },
471     ],
472     'SVN' => [
473         "Subversion server (svnserve)",
474         { action => 'PARAM', proto => 'tcp', dport => '3690' },
475     ],
476     'SixXS' => [
477         "SixXS IPv6 Deployment and Tunnel Broker",
478         { action => 'PARAM', proto => 'tcp', dport => '3874' },
479         { action => 'PARAM', proto => 'udp', dport => '3740' },
480         { action => 'PARAM', proto => '41' },
481         { action => 'PARAM', proto => 'udp', dport => '5072,8374' },
482     ],
483     'Squid' => [
484         "Squid web proxy traffic",
485         { action => 'PARAM', proto => 'tcp', dport => '3128' },
486     ],
487     'Submission' => [
488         "Mail message submission traffic",
489         { action => 'PARAM', proto => 'tcp', dport => '587' },
490     ],
491     'Syslog' => [
492         "Syslog protocol (RFC 5424) traffic",
493         { action => 'PARAM', proto => 'udp', dport => '514' },
494         { action => 'PARAM', proto => 'tcp', dport => '514' },
495     ],
496     'TFTP' => [
497         "Trivial File Transfer Protocol traffic",
498         { action => 'PARAM', proto => 'udp', dport => '69' },
499     ],
500     'Telnet' => [
501         "Telnet traffic",
502         { action => 'PARAM', proto => 'tcp', dport => '23' },
503     ],
504     'Telnets' => [
505         "Telnet over SSL",
506         { action => 'PARAM', proto => 'tcp', dport => '992' },
507     ],
508     'Time' => [
509         "RFC 868 Time protocol",
510         { action => 'PARAM', proto => 'tcp', dport => '37' },
511     ],
512     'Trcrt' => [
513         "Traceroute (for up to 30 hops) traffic",
514         { action => 'PARAM', proto => 'udp', dport => '33434:33524' },
515         { action => 'PARAM', proto => 'icmp', dport => 'echo-request' },
516     ],
517     'VNC' => [
518         "VNC traffic for VNC display's 0 - 99",
519         { action => 'PARAM', proto => 'tcp', dport => '5900:5999' },
520     ],
521     'VNCL' => [
522         "VNC traffic from Vncservers to Vncviewers in listen mode",
523         { action => 'PARAM', proto => 'tcp', dport => '5500' },
524     ],
525     'Web' => [
526         "WWW traffic (HTTP and HTTPS)",
527         { action => 'PARAM', proto => 'tcp', dport => '80' },
528         { action => 'PARAM', proto => 'tcp', dport => '443' },
529     ],
530     'Webcache' => [
531         "Web Cache/Proxy traffic (port 8080)",
532         { action => 'PARAM', proto => 'tcp', dport => '8080' },
533     ],
534     'Webmin' => [
535         "Webmin traffic",
536         { action => 'PARAM', proto => 'tcp', dport => '10000' },
537     ],
538     'Whois' => [
539         "Whois (nicname, RFC 3912) traffic",
540         { action => 'PARAM', proto => 'tcp', dport => '43' },
541     ],
542 };
543
544 my $pve_fw_parsed_macros;
545 my $pve_fw_macro_descr;
546 my $pve_fw_macro_ipversion = {};
547 my $pve_fw_preferred_macro_names = {};
548
549 my $FWACCEPTMARK_ON  = "0x80000000/0x80000000";
550 my $FWACCEPTMARK_OFF = "0x00000000/0x80000000";
551
552 my $pve_std_chains = {};
553 my $pve_std_chains_conf = {};
554 $pve_std_chains_conf->{4} = {
555     'PVEFW-SET-ACCEPT-MARK' => [
556         { target => "-j MARK --set-mark $FWACCEPTMARK_ON" },
557     ],
558     'PVEFW-DropBroadcast' => [
559         # same as shorewall 'Broadcast'
560         # simply DROP BROADCAST/MULTICAST/ANYCAST
561         # we can use this to reduce logging
562         { action => 'DROP', dsttype => 'BROADCAST' },
563         { action => 'DROP', dsttype => 'MULTICAST' },
564         { action => 'DROP', dsttype => 'ANYCAST' },
565         { action => 'DROP', dest => '224.0.0.0/4' },
566     ],
567     'PVEFW-reject' => [
568         # same as shorewall 'reject'
569         { action => 'DROP', dsttype => 'BROADCAST' },
570         { action => 'DROP', source => '224.0.0.0/4' },
571         { action => 'DROP', proto => 'icmp' },
572         { match => '-p tcp', target => '-j REJECT --reject-with tcp-reset' },
573         { match => '-p udp', target => '-j REJECT --reject-with icmp-port-unreachable' },
574         { match => '-p icmp', target => '-j REJECT --reject-with icmp-host-unreachable' },
575         { target => '-j REJECT --reject-with icmp-host-prohibited' },
576     ],
577     'PVEFW-Drop' => [
578         # same as shorewall 'Drop', which is equal to DROP,
579         # but REJECT/DROP some packages to reduce logging,
580         # and ACCEPT critical ICMP types
581         { action => 'PVEFW-reject',  proto => 'tcp', dport => '43' }, # REJECT 'auth'
582         # we are not interested in BROADCAST/MULTICAST/ANYCAST
583         { action => 'PVEFW-DropBroadcast' },
584         # ACCEPT critical ICMP types
585         { action => 'ACCEPT', proto => 'icmp', dport => 'fragmentation-needed' },
586         { action => 'ACCEPT', proto => 'icmp', dport => 'time-exceeded' },
587         # Drop packets with INVALID state
588         { action => 'DROP', match => '-m conntrack --ctstate INVALID', },
589         # Drop Microsoft SMB noise
590         { action => 'DROP', proto => 'udp', dport => '135,445' },
591         { action => 'DROP', proto => 'udp', dport => '137:139' },
592         { action => 'DROP', proto => 'udp', dport => '1024:65535', sport => 137 },
593         { action => 'DROP', proto => 'tcp', dport => '135,139,445' },
594         { action => 'DROP', proto => 'udp', dport => 1900 }, # UPnP
595         # Drop new/NotSyn traffic so that it doesn't get logged
596         { action => 'DROP', match => '-p tcp -m tcp ! --tcp-flags FIN,SYN,RST,ACK SYN' },
597         # Drop DNS replies
598         { action => 'DROP', proto => 'udp', sport => 53 },
599     ],
600     'PVEFW-Reject' => [
601         # same as shorewall 'Reject', which is equal to Reject,
602         # but REJECT/DROP some packages to reduce logging,
603         # and ACCEPT critical ICMP types
604         { action => 'PVEFW-reject',  proto => 'tcp', dport => '43' }, # REJECT 'auth'
605         # we are not interested in BROADCAST/MULTICAST/ANYCAST
606         { action => 'PVEFW-DropBroadcast' },
607         # ACCEPT critical ICMP types
608         { action => 'ACCEPT', proto => 'icmp', dport => 'fragmentation-needed' },
609         { action => 'ACCEPT', proto => 'icmp', dport => 'time-exceeded' },
610         # Drop packets with INVALID state
611         { action => 'DROP', match => '-m conntrack --ctstate INVALID', },
612         # Drop Microsoft SMB noise
613         { action => 'PVEFW-reject', proto => 'udp', dport => '135,445' },
614         { action => 'PVEFW-reject', proto => 'udp', dport => '137:139'},
615         { action => 'PVEFW-reject', proto => 'udp', dport => '1024:65535', sport => 137 },
616         { action => 'PVEFW-reject', proto => 'tcp', dport => '135,139,445' },
617         { action => 'DROP', proto => 'udp', dport => 1900 }, # UPnP
618         # Drop new/NotSyn traffic so that it doesn't get logged
619         { action => 'DROP', match => '-p tcp -m tcp ! --tcp-flags FIN,SYN,RST,ACK SYN' },
620         # Drop DNS replies
621         { action => 'DROP', proto => 'udp', sport => 53 },
622     ],
623     'PVEFW-tcpflags' => [
624         # same as shorewall tcpflags action.
625         # Packets arriving on this interface are checked for som illegal combinations of TCP flags
626         { match => '-p tcp -m tcp --tcp-flags FIN,SYN,RST,PSH,ACK,URG FIN,PSH,URG', target => '-g PVEFW-logflags' },
627         { match => '-p tcp -m tcp --tcp-flags FIN,SYN,RST,PSH,ACK,URG NONE', target => '-g PVEFW-logflags' },
628         { match => '-p tcp -m tcp --tcp-flags SYN,RST SYN,RST', target => '-g PVEFW-logflags' },
629         { match => '-p tcp -m tcp --tcp-flags FIN,SYN FIN,SYN', target => '-g PVEFW-logflags' },
630         { match => '-p tcp -m tcp --sport 0 --tcp-flags FIN,SYN,RST,ACK SYN', target => '-g PVEFW-logflags' },
631     ],
632     'PVEFW-smurfs' => [
633         # same as shorewall smurfs action
634         # Filter packets for smurfs (packets with a broadcast address as the source).
635         { match => '-s 0.0.0.0/32', target => '-j RETURN' }, # allow DHCP
636         { match => '-m addrtype --src-type BROADCAST', target => '-g PVEFW-smurflog' },
637         { match => '-s 224.0.0.0/4', target => '-g PVEFW-smurflog' },
638     ],
639     'PVEFW-smurflog' => [
640         { action => 'DROP', logmsg => 'DROP: ' },
641     ],
642     'PVEFW-logflags' => [
643         { action => 'DROP', logmsg => 'DROP: ' },
644     ],
645 };
646
647 $pve_std_chains_conf->{6} = {
648     'PVEFW-SET-ACCEPT-MARK' => [
649         { target => "-j MARK --set-mark $FWACCEPTMARK_ON" },
650     ],
651     'PVEFW-DropBroadcast' => [
652         # same as shorewall 'Broadcast'
653         # simply DROP BROADCAST/MULTICAST/ANYCAST
654         # we can use this to reduce logging
655         #{ action => 'DROP', dsttype => 'BROADCAST' }, #no broadcast in ipv6
656         # ipv6 addrtype does not work with kernel 2.6.32
657         #{ action => 'DROP', dsttype => 'MULTICAST' },
658         #{ action => 'DROP', dsttype => 'ANYCAST' },
659         { action => 'DROP', dest => 'ff00::/8' },
660         #{ action => 'DROP', dest => '224.0.0.0/4' },
661     ],
662     'PVEFW-reject' => [
663         # same as shorewall 'reject'
664         #{ action => 'DROP', dsttype => 'BROADCAST' },
665         #{ action => 'DROP', source => '224.0.0.0/4' },
666         { action => 'DROP', proto => 'icmpv6' },
667         { match => '-p tcp', target => '-j REJECT --reject-with tcp-reset' },
668         #"-p udp -j REJECT --reject-with icmp-port-unreachable",
669         #"-p icmp -j REJECT --reject-with icmp-host-unreachable",
670         #"-j REJECT --reject-with icmp-host-prohibited",
671     ],
672     'PVEFW-Drop' => [
673         # same as shorewall 'Drop', which is equal to DROP,
674         # but REJECT/DROP some packages to reduce logging,
675         # and ACCEPT critical ICMP types
676         { action => 'PVEFW-reject', proto => 'tcp', dport => '43' }, # REJECT 'auth'
677         # we are not interested in BROADCAST/MULTICAST/ANYCAST
678         { action => 'PVEFW-DropBroadcast' },
679         # ACCEPT critical ICMP types
680         { action => 'ACCEPT', proto => 'icmpv6', dport => 'destination-unreachable' },
681         { action => 'ACCEPT', proto => 'icmpv6', dport => 'time-exceeded' },
682         { action => 'ACCEPT', proto => 'icmpv6', dport => 'packet-too-big' },
683         # Drop packets with INVALID state
684         { action => 'DROP', match => '-m conntrack --ctstate INVALID', },
685         # Drop Microsoft SMB noise
686         { action => 'DROP', proto => 'udp', dport => '135,445' },
687         { action => 'DROP', proto => 'udp', dport => '137:139'},
688         { action => 'DROP', proto => 'udp', dport => '1024:65535', sport => 137 },
689         { action => 'DROP', proto => 'tcp', dport => '135,139,445' },
690         { action => 'DROP', proto => 'udp', dport => 1900 }, # UPnP
691         # Drop new/NotSyn traffic so that it doesn't get logged
692         { action => 'DROP', match => '-p tcp -m tcp ! --tcp-flags FIN,SYN,RST,ACK SYN' },
693         # Drop DNS replies
694         { action => 'DROP', proto => 'udp', sport => 53 },
695     ],
696     'PVEFW-Reject' => [
697         # same as shorewall 'Reject', which is equal to Reject,
698         # but REJECT/DROP some packages to reduce logging,
699         # and ACCEPT critical ICMP types
700         { action => 'PVEFW-reject',  proto => 'tcp', dport => '43' }, # REJECT 'auth'
701         # we are not interested in BROADCAST/MULTICAST/ANYCAST
702         { action => 'PVEFW-DropBroadcast' },
703         # ACCEPT critical ICMP types
704         { action => 'ACCEPT', proto => 'icmpv6', dport => 'destination-unreachable' },
705         { action => 'ACCEPT', proto => 'icmpv6', dport => 'time-exceeded' },
706         { action => 'ACCEPT', proto => 'icmpv6', dport => 'packet-too-big' },
707         # Drop packets with INVALID state
708         { action => 'DROP', match => '-m conntrack --ctstate INVALID', },
709         # Drop Microsoft SMB noise
710         { action => 'PVEFW-reject', proto => 'udp', dport => '135,445' },
711         { action => 'PVEFW-reject', proto => 'udp', dport => '137:139' },
712         { action => 'PVEFW-reject', proto => 'udp', dport => '1024:65535', sport => 137 },
713         { action => 'PVEFW-reject', proto => 'tcp', dport => '135,139,445' },
714         { action => 'DROP', proto => 'udp', dport => 1900 }, # UPnP
715         # Drop new/NotSyn traffic so that it doesn't get logged
716         { action => 'DROP', match => '-p tcp -m tcp ! --tcp-flags FIN,SYN,RST,ACK SYN' },
717         # Drop DNS replies
718         { action => 'DROP', proto => 'udp', sport => 53 },
719     ],
720     'PVEFW-tcpflags' => [
721         # same as shorewall tcpflags action.
722         # Packets arriving on this interface are checked for som illegal combinations of TCP flags
723         { match => '-p tcp -m tcp --tcp-flags FIN,SYN,RST,PSH,ACK,URG FIN,PSH,URG', target => '-g PVEFW-logflags' },
724         { match => '-p tcp -m tcp --tcp-flags FIN,SYN,RST,PSH,ACK,URG NONE', target => '-g PVEFW-logflags' },
725         { match => '-p tcp -m tcp --tcp-flags SYN,RST SYN,RST', target => '-g PVEFW-logflags' },
726         { match => '-p tcp -m tcp --tcp-flags FIN,SYN FIN,SYN', target => '-g PVEFW-logflags' },
727         { match => '-p tcp -m tcp --sport 0 --tcp-flags FIN,SYN,RST,ACK SYN', target => '-g PVEFW-logflags' },
728     ],
729     'PVEFW-logflags' => [
730         { action => 'DROP', logmsg => 'DROP: ' },
731     ],
732 };
733
734 # iptables -p icmp -h
735 my $icmp_type_names = {
736     any => 1,
737     'echo-reply' => 1,
738     'destination-unreachable' => 1,
739     'network-unreachable' => 1,
740     'host-unreachable' => 1,
741     'protocol-unreachable' => 1,
742     'port-unreachable' => 1,
743     'fragmentation-needed' => 1,
744     'source-route-failed' => 1,
745     'network-unknown' => 1,
746     'host-unknown' => 1,
747     'network-prohibited' => 1,
748     'host-prohibited' => 1,
749     'TOS-network-unreachable' => 1,
750     'TOS-host-unreachable' => 1,
751     'communication-prohibited' => 1,
752     'host-precedence-violation' => 1,
753     'precedence-cutoff' => 1,
754     'source-quench' => 1,
755     'redirect' => 1,
756     'network-redirect' => 1,
757     'host-redirect' => 1,
758     'TOS-network-redirect' => 1,
759     'TOS-host-redirect' => 1,
760     'echo-request' => 1,
761     'router-advertisement' => 1,
762     'router-solicitation' => 1,
763     'time-exceeded' => 1,
764     'ttl-zero-during-transit' => 1,
765     'ttl-zero-during-reassembly' => 1,
766     'parameter-problem' => 1,
767     'ip-header-bad' => 1,
768     'required-option-missing' => 1,
769     'timestamp-request' => 1,
770     'timestamp-reply' => 1,
771     'address-mask-request' => 1,
772     'address-mask-reply' => 1,
773 };
774
775 # ip6tables -p icmpv6 -h
776
777 my $icmpv6_type_names = {
778     'any' => 1,
779     'destination-unreachable' => 1,
780     'no-route' => 1,
781     'communication-prohibited' => 1,
782     'address-unreachable' => 1,
783     'port-unreachable' => 1,
784     'packet-too-big' => 1,
785     'time-exceeded' => 1,
786     'ttl-zero-during-transit' => 1,
787     'ttl-zero-during-reassembly' => 1,
788     'parameter-problem' => 1,
789     'bad-header' => 1,
790     'unknown-header-type' => 1,
791     'unknown-option' => 1,
792     'echo-request' => 1,
793     'echo-reply' => 1,
794     'router-solicitation' => 1,
795     'router-advertisement' => 1,
796     'neighbor-solicitation' => 1,
797     'neighbour-solicitation' => 1,
798     'neighbor-advertisement' => 1,
799     'neighbour-advertisement' => 1,
800     'redirect' => 1,
801 };
802
803 sub init_firewall_macros {
804
805     $pve_fw_parsed_macros = {};
806
807     my $parse = sub {
808         my ($k, $macro) = @_;
809         my $lc_name = lc($k);
810         $pve_fw_macro_ipversion->{$k} = 0;
811         while (!ref($macro->[0])) {
812             my $desc = shift @$macro;
813             if ($desc eq 'ipv4only') {
814                 $pve_fw_macro_ipversion->{$k} = 4;
815             } elsif ($desc eq 'ipv6only') {
816                 $pve_fw_macro_ipversion->{$k} = 6;
817             } else {
818                 $pve_fw_macro_descr->{$k} = $desc;
819             }
820         }
821         $pve_fw_preferred_macro_names->{$lc_name} = $k;
822         $pve_fw_parsed_macros->{$k} = $macro;
823     };
824
825     foreach my $k (keys %$pve_fw_macros) {
826         &$parse($k, $pve_fw_macros->{$k});
827     }
828
829     foreach my $k (keys %$pve_ipv6fw_macros) {
830         next if $pve_fw_parsed_macros->{$k};
831         &$parse($k, $pve_ipv6fw_macros->{$k});
832         $pve_fw_macro_ipversion->{$k} = 6;
833     }
834 }
835
836 init_firewall_macros();
837
838 sub get_macros {
839     return wantarray ? ($pve_fw_parsed_macros, $pve_fw_macro_descr): $pve_fw_parsed_macros;
840 }
841
842 my $etc_services;
843
844 sub get_etc_services {
845
846     return $etc_services if $etc_services;
847
848     my $filename = "/etc/services";
849
850     my $fh = IO::File->new($filename, O_RDONLY);
851     if (!$fh) {
852         warn "unable to read '$filename' - $!\n";
853         return {};
854     }
855
856     my $services = {};
857
858     while (my $line = <$fh>) {
859         chomp ($line);
860         next if $line =~m/^#/;
861         next if ($line =~m/^\s*$/);
862
863         if ($line =~ m!^(\S+)\s+(\S+)/(tcp|udp|sctp).*$!) {
864             $services->{byid}->{$2}->{name} = $1;
865             $services->{byid}->{$2}->{port} = $2;
866             $services->{byid}->{$2}->{$3} = 1;
867             $services->{byname}->{$1} = $services->{byid}->{$2};
868         }
869     }
870
871     close($fh);
872
873     $etc_services = $services;
874
875
876     return $etc_services;
877 }
878
879 sub parse_protocol_file {
880     my ($filename) = @_;
881
882     my $fh = IO::File->new($filename, O_RDONLY);
883     if (!$fh) {
884         warn "unable to read '$filename' - $!\n";
885         return {};
886     }
887
888     my $protocols = {};
889
890     while (my $line = <$fh>) {
891         chomp ($line);
892         next if $line =~m/^#/;
893         next if ($line =~m/^\s*$/);
894
895         if ($line =~ m!^(\S+)\s+(\d+)(?:\s+.*)?$!) {
896             $protocols->{byid}->{$2}->{name} = $1;
897             $protocols->{byname}->{$1} = $protocols->{byid}->{$2};
898         }
899     }
900
901     close($fh);
902
903     return $protocols;
904 }
905
906 my $etc_protocols;
907
908 sub get_etc_protocols {
909     return $etc_protocols if $etc_protocols;
910
911     my $protocols = parse_protocol_file('/etc/protocols');
912
913     # add special case for ICMP v6
914     $protocols->{byid}->{icmpv6}->{name} = "icmpv6";
915     $protocols->{byname}->{icmpv6} = $protocols->{byid}->{icmpv6};
916
917     $etc_protocols = $protocols;
918
919     return $etc_protocols;
920 }
921
922 my $etc_ethertypes;
923
924 sub get_etc_ethertypes {
925     $etc_ethertypes = parse_protocol_file('/etc/ethertypes')
926         if !$etc_ethertypes;
927     return $etc_ethertypes;
928 }
929
930 my $__local_network;
931
932 sub local_network {
933     my ($new_value) = @_;
934
935     $__local_network = $new_value if defined($new_value);
936
937     return $__local_network if defined($__local_network);
938
939     eval {
940         my $nodename = PVE::INotify::nodename();
941
942         my $ip = PVE::Cluster::remote_node_ip($nodename);
943
944         my $testip = Net::IP->new($ip);
945
946         my $isv6 = $testip->version == 6;
947         my $routes = $isv6 ? PVE::ProcFSTools::read_proc_net_ipv6_route()
948                            : PVE::ProcFSTools::read_proc_net_route();
949         foreach my $entry (@$routes) {
950             my $mask;
951             if ($isv6) {
952                 $mask = $entry->{prefix};
953                 next if !$mask; # skip the default route...
954             } else {
955                 $mask = $PVE::Network::ipv4_mask_hash_localnet->{$entry->{mask}};
956                 next if !defined($mask);
957             }
958             my $cidr = "$entry->{dest}/$mask";
959             my $testnet = Net::IP->new($cidr);
960             my $overlap = $testnet->overlaps($testip);
961             if ($overlap == $Net::IP::IP_B_IN_A_OVERLAP ||
962                 $overlap == $Net::IP::IP_IDENTICAL)
963             {
964                 $__local_network = $cidr;
965                 return;
966             }
967         }
968     };
969     warn $@ if $@;
970
971     return $__local_network;
972 }
973
974 # ipset names are limited to 31 characters,
975 # and we use '-v4' or '-v6' to indicate IP versions, 
976 # and we use '_swap' suffix for atomic update, 
977 # for example PVEFW-${VMID}-${ipset_name}_swap
978
979 my $max_iptables_ipset_name_length = 31 - length("PVEFW-") - length("_swap");
980
981 sub compute_ipset_chain_name {
982     my ($vmid, $ipset_name, $ipversion) = @_;
983
984     $vmid = 0 if !defined($vmid);
985
986     my $id = "$vmid-${ipset_name}-v$ipversion";
987
988     if (length($id) > $max_iptables_ipset_name_length) {
989         $id = PVE::Tools::fnv31a_hex($id);
990     }
991
992     return "PVEFW-$id";
993 }
994
995 sub compute_ipfilter_ipset_name {
996     my ($iface) = @_;
997
998     return "ipfilter-$iface";
999 }
1000
1001 sub parse_address_list {
1002     my ($str) = @_;
1003
1004     if ($str =~ m/^(\+)(\S+)$/) { # ipset ref
1005         die "ipset name too long\n" if length($str) > ($max_ipset_name_length + 1);
1006         return;
1007     }
1008
1009     if ($str =~ m/^${ip_alias_pattern}$/) {
1010         die "alias name too long\n" if length($str) > $max_alias_name_length;
1011         return;
1012     }
1013
1014     my $count = 0;
1015     my $iprange = 0;
1016     my $ipversion;
1017
1018     my @elements = split(/,/, $str);
1019     die "extraneous commas in list\n" if $str ne join(',', @elements);
1020     foreach my $elem (@elements) {
1021         $count++;
1022         my $ip = Net::IP->new($elem);
1023         if (!$ip) {
1024             my $err = Net::IP::Error();
1025             die "invalid IP address: $err\n";
1026         }
1027         $iprange = 1 if $elem =~ m/-/;
1028
1029         my $new_ipversion = Net::IP::ip_is_ipv6($ip->ip()) ? 6 : 4;
1030
1031         die "detected mixed ipv4/ipv6 addresses in address list '$str'\n"
1032             if $ipversion && ($new_ipversion != $ipversion);
1033
1034         $ipversion = $new_ipversion;
1035     }
1036
1037     die "you can't use a range in a list\n" if $iprange && $count > 1;
1038
1039     return $ipversion;
1040 }
1041
1042 sub parse_port_name_number_or_range {
1043     my ($str, $dport) = @_;
1044
1045     my $services = PVE::Firewall::get_etc_services();
1046     my $count = 0;
1047     my $icmp_port = 0;
1048
1049     my @elements = split(/,/, $str);
1050     die "extraneous commas in list\n" if $str ne join(',', @elements);
1051     foreach my $item (@elements) {
1052         if ($item =~ m/^([0-9]+):([0-9]+)$/) {
1053             $count += 2;
1054             my ($port1, $port2) = ($1, $2);
1055             die "invalid port '$port1'\n" if $port1 > 65535;
1056             die "invalid port '$port2'\n" if $port2 > 65535;
1057             die "backwards range '$port1:$port2' not allowed, did you mean '$port2:$port1'?\n" if $port1 > $port2;
1058         } elsif ($item =~ m/^([0-9]+)$/) {
1059             $count += 1;
1060             my $port = $1;
1061             die "invalid port '$port'\n" if $port > 65535;
1062         } else {
1063             if ($dport && $icmp_type_names->{$item}) {
1064                 $icmp_port = 1;
1065             } elsif ($dport && $icmpv6_type_names->{$item}) {
1066                 $icmp_port = 1;
1067             } else {
1068                 die "invalid port '$item'\n" if !$services->{byname}->{$item};
1069             }
1070         }
1071     }
1072
1073     die "ICPM ports not allowed in port range\n" if $icmp_port && $count > 0;
1074
1075     # I really don't like to use the word number here, but it's the only thing
1076     # that makes sense in a literal way. The range 1:100 counts as 2, not as
1077     # one and not as 100...
1078     die "too many entries in port list (> 15 numbers)\n"
1079         if $count > 15;
1080
1081     return (scalar(@elements) > 1);
1082 }
1083
1084 PVE::JSONSchema::register_format('pve-fw-sport-spec', \&pve_fw_verify_sport_spec);
1085 sub pve_fw_verify_sport_spec {
1086    my ($portstr) = @_;
1087
1088    parse_port_name_number_or_range($portstr, 0);
1089
1090    return $portstr;
1091 }
1092
1093 PVE::JSONSchema::register_format('pve-fw-dport-spec', \&pve_fw_verify_dport_spec);
1094 sub pve_fw_verify_dport_spec {
1095    my ($portstr) = @_;
1096
1097    parse_port_name_number_or_range($portstr, 1);
1098
1099    return $portstr;
1100 }
1101
1102 PVE::JSONSchema::register_format('pve-fw-addr-spec', \&pve_fw_verify_addr_spec);
1103 sub pve_fw_verify_addr_spec {
1104    my ($list) = @_;
1105
1106    parse_address_list($list);
1107
1108    return $list;
1109 }
1110
1111 PVE::JSONSchema::register_format('pve-fw-protocol-spec', \&pve_fw_verify_protocol_spec);
1112 sub pve_fw_verify_protocol_spec {
1113    my ($proto) = @_;
1114
1115    my $protocols = get_etc_protocols();
1116
1117    die "unknown protocol '$proto'\n" if $proto &&
1118        !(defined($protocols->{byname}->{$proto}) ||
1119          defined($protocols->{byid}->{$proto}));
1120
1121    return $proto;
1122 }
1123
1124
1125 # helper function for API
1126
1127 sub copy_opject_with_digest {
1128     my ($object) = @_;
1129
1130     my $sha = Digest::SHA->new('sha1');
1131
1132     my $res = {};
1133     foreach my $k (sort keys %$object) {
1134         my $v = $object->{$k};
1135         next if !defined($v);
1136         $res->{$k} = $v;
1137         $sha->add($k, ':', $v, "\n");
1138     }
1139
1140     my $digest = $sha->hexdigest;
1141
1142     $res->{digest} = $digest;
1143
1144     return wantarray ? ($res, $digest) : $res;
1145 }
1146
1147 sub copy_list_with_digest {
1148     my ($list) = @_;
1149
1150     my $sha = Digest::SHA->new('sha1');
1151
1152     my $res = [];
1153     foreach my $entry (@$list) {
1154         my $data = {};
1155         foreach my $k (sort keys %$entry) {
1156             my $v = $entry->{$k};
1157             next if !defined($v);
1158             $data->{$k} = $v;
1159             # Note: digest ignores refs ($rule->{errors})
1160             # since Digest::SHA expects a series of bytes,
1161             #  we have to encode the value here to prevent errors when
1162             #  using utf8 characters (eg. in comments)
1163             $sha->add($k, ':', encode_utf8($v), "\n") if !ref($v); ;
1164         }
1165         push @$res, $data;
1166     }
1167
1168     my $digest = $sha->hexdigest;
1169
1170     foreach my $entry (@$res) {
1171         $entry->{digest} = $digest;
1172     }
1173
1174     return wantarray ? ($res, $digest) : $res;
1175 }
1176
1177 our $cluster_option_properties = {
1178     enable => {
1179         description => "Enable or disable the firewall cluster wide.",
1180         type => 'integer',
1181         minimum => 0,
1182         optional => 1,
1183     },
1184     ebtables => {
1185         description => "Enable ebtables rules cluster wide.",
1186         type => 'boolean',
1187         default => 1,
1188         optional => 1,
1189     },
1190     policy_in => {
1191         description => "Input policy.",
1192         type => 'string',
1193         optional => 1,
1194         enum => ['ACCEPT', 'REJECT', 'DROP'],
1195     },
1196     policy_out => {
1197         description => "Output policy.",
1198         type => 'string',
1199         optional => 1,
1200         enum => ['ACCEPT', 'REJECT', 'DROP'],
1201     },
1202 };
1203
1204 our $host_option_properties = {
1205     enable => {
1206         description => "Enable host firewall rules.",
1207         type => 'boolean',
1208         optional => 1,
1209     },
1210     log_level_in =>  get_standard_option('pve-fw-loglevel', {
1211         description => "Log level for incoming traffic." }),
1212     log_level_out =>  get_standard_option('pve-fw-loglevel', {
1213         description => "Log level for outgoing traffic." }),
1214     tcp_flags_log_level =>  get_standard_option('pve-fw-loglevel', {
1215         description => "Log level for illegal tcp flags filter." }),
1216     smurf_log_level =>  get_standard_option('pve-fw-loglevel', {
1217         description => "Log level for SMURFS filter." }),
1218     nosmurfs => {
1219         description => "Enable SMURFS filter.",
1220         type => 'boolean',
1221         optional => 1,
1222     },
1223     tcpflags => {
1224         description => "Filter illegal combinations of TCP flags.",
1225         type => 'boolean',
1226         optional => 1,
1227     },
1228     nf_conntrack_max => {
1229         description => "Maximum number of tracked connections.",
1230         type => 'integer',
1231         optional => 1,
1232         minimum => 32768,
1233     },
1234     nf_conntrack_tcp_timeout_established => {
1235         description => "Conntrack established timeout.",
1236         type => 'integer',
1237         optional => 1,
1238         minimum => 7875,
1239     },
1240     ndp => {
1241         description => "Enable NDP.",
1242         type => 'boolean',
1243         optional => 1,
1244     },
1245     nf_conntrack_allow_invalid => {
1246         description => "Allow invalid packets on connection tracking.",
1247         type => 'boolean',
1248         default => 0,
1249         optional => 1,
1250     },
1251 };
1252
1253 our $vm_option_properties = {
1254     enable => {
1255         description => "Enable/disable firewall rules.",
1256         type => 'boolean',
1257         optional => 1,
1258     },
1259     macfilter => {
1260         description => "Enable/disable MAC address filter.",
1261         type => 'boolean',
1262         optional => 1,
1263     },
1264     dhcp => {
1265         description => "Enable DHCP.",
1266         type => 'boolean',
1267         optional => 1,
1268     },
1269     ndp => {
1270         description => "Enable NDP.",
1271         type => 'boolean',
1272         optional => 1,
1273     },
1274     radv => {
1275         description => "Allow sending Router Advertisement.",
1276         type => 'boolean',
1277         optional => 1,
1278     },
1279     ipfilter => {
1280         description => "Enable default IP filters. " .
1281            "This is equivalent to adding an empty ipfilter-net<id> ipset " .
1282            "for every interface. Such ipsets implicitly contain sane default " .
1283            "restrictions such as restricting IPv6 link local addresses to " .
1284            "the one derived from the interface's MAC address. For containers " .
1285            "the configured IP addresses will be implicitly added.",
1286         type => 'boolean',
1287         optional => 1,
1288     },
1289     policy_in => {
1290         description => "Input policy.",
1291         type => 'string',
1292         optional => 1,
1293         enum => ['ACCEPT', 'REJECT', 'DROP'],
1294     },
1295     policy_out => {
1296         description => "Output policy.",
1297         type => 'string',
1298         optional => 1,
1299         enum => ['ACCEPT', 'REJECT', 'DROP'],
1300     },
1301     log_level_in =>  get_standard_option('pve-fw-loglevel', {
1302         description => "Log level for incoming traffic." }),
1303     log_level_out =>  get_standard_option('pve-fw-loglevel', {
1304         description => "Log level for outgoing traffic." }),
1305
1306 };
1307
1308
1309 my $addr_list_descr = "This can refer to a single IP address, an IP set ('+ipsetname') or an IP alias definition. You can also specify an address range like '20.34.101.207-201.3.9.99', or a list of IP addresses and networks (entries are separated by comma). Please do not mix IPv4 and IPv6 addresses inside such lists.";
1310
1311 my $port_descr = "You can use service names or simple numbers (0-65535), as defined in '/etc/services'. Port ranges can be specified with '\\d+:\\d+', for example '80:85', and you can use comma separated list to match several ports or ranges.";
1312
1313 my $rule_properties = {
1314     pos => {
1315         description => "Update rule at position <pos>.",
1316         type => 'integer',
1317         minimum => 0,
1318         optional => 1,
1319     },
1320     digest => get_standard_option('pve-config-digest'),
1321     type => {
1322         description => "Rule type.",
1323         type => 'string',
1324         optional => 1,
1325         enum => ['in', 'out', 'group'],
1326     },
1327     action => {
1328         description => "Rule action ('ACCEPT', 'DROP', 'REJECT') or security group name.",
1329         type => 'string',
1330         optional => 1,
1331         pattern => $security_group_name_pattern,
1332         maxLength => 20,
1333         minLength => 2,
1334     },
1335     macro => {
1336         description => "Use predefined standard macro.",
1337         type => 'string',
1338         optional => 1,
1339         maxLength => 128,
1340     },
1341     iface => get_standard_option('pve-iface', {
1342         description => "Network interface name. You have to use network configuration key names for VMs and containers ('net\\d+'). Host related rules can use arbitrary strings.",
1343         optional => 1
1344     }),
1345     source => {
1346         description => "Restrict packet source address. $addr_list_descr",
1347         type => 'string', format => 'pve-fw-addr-spec',
1348         optional => 1,
1349     },
1350     dest => {
1351         description => "Restrict packet destination address. $addr_list_descr",
1352         type => 'string', format => 'pve-fw-addr-spec',
1353         optional => 1,
1354     },
1355     proto => {
1356         description => "IP protocol. You can use protocol names ('tcp'/'udp') or simple numbers, as defined in '/etc/protocols'.",
1357         type => 'string', format => 'pve-fw-protocol-spec',
1358         optional => 1,
1359     },
1360     enable => {
1361         description => "Flag to enable/disable a rule.",
1362         type => 'integer',
1363         minimum => 0,
1364         optional => 1,
1365     },
1366     sport => {
1367         description => "Restrict TCP/UDP source port. $port_descr",
1368         type => 'string', format => 'pve-fw-sport-spec',
1369         optional => 1,
1370     },
1371     dport => {
1372         description => "Restrict TCP/UDP destination port. $port_descr",
1373         type => 'string', format => 'pve-fw-dport-spec',
1374         optional => 1,
1375     },
1376     comment => {
1377         description => "Descriptive comment.",
1378         type => 'string',
1379         optional => 1,
1380     },
1381 };
1382
1383 sub add_rule_properties {
1384     my ($properties) = @_;
1385
1386     foreach my $k (keys %$rule_properties) {
1387         my $h = $rule_properties->{$k};
1388         # copy data, so that we can modify later without side effects
1389         foreach my $opt (keys %$h) { $properties->{$k}->{$opt} = $h->{$opt}; }
1390     }
1391
1392     return $properties;
1393 }
1394
1395 sub delete_rule_properties {
1396     my ($rule, $delete_str) = @_;
1397
1398     foreach my $opt (PVE::Tools::split_list($delete_str)) {
1399         raise_param_exc({ 'delete' => "no such property ('$opt')"})
1400             if !defined($rule_properties->{$opt});
1401         raise_param_exc({ 'delete' => "unable to delete required property '$opt'"})
1402             if $opt eq 'type' || $opt eq 'action';
1403         delete $rule->{$opt};
1404     }
1405
1406     return $rule;
1407 }
1408
1409 my $apply_macro = sub {
1410     my ($macro_name, $param, $verify, $ipversion) = @_;
1411
1412     my $macro_rules = $pve_fw_parsed_macros->{$macro_name};
1413     die "unknown macro '$macro_name'\n" if !$macro_rules; # should not happen
1414
1415     if ($ipversion && ($ipversion == 6) && $pve_ipv6fw_macros->{$macro_name}) {
1416         $macro_rules = $pve_ipv6fw_macros->{$macro_name};
1417     }
1418
1419     # skip macros which are specific to another ipversion
1420     if ($ipversion && (my $required = $pve_fw_macro_ipversion->{$macro_name})) {
1421         return if $ipversion != $required;
1422     }
1423
1424     my $rules = [];
1425
1426     foreach my $templ (@$macro_rules) {
1427         my $rule = {};
1428         my $param_used = {};
1429         foreach my $k (keys %$templ) {
1430             my $v = $templ->{$k};
1431             if ($v eq 'PARAM') {
1432                 $v = $param->{$k};
1433                 $param_used->{$k} = 1;
1434             } elsif ($v eq 'DEST') {
1435                 $v = $param->{dest};
1436                 $param_used->{dest} = 1;
1437             } elsif ($v eq 'SOURCE') {
1438                 $v = $param->{source};
1439                 $param_used->{source} = 1;
1440             }
1441
1442             if (!defined($v)) {
1443                 my $msg = "missing parameter '$k' in macro '$macro_name'";
1444                 raise_param_exc({ macro => $msg }) if $verify;
1445                 die "$msg\n";
1446             }
1447             $rule->{$k} = $v;
1448         }
1449         foreach my $k (keys %$param) {
1450             next if $k eq 'macro';
1451             next if !defined($param->{$k});
1452             next if $param_used->{$k};
1453             if (defined($rule->{$k})) {
1454                 if ($rule->{$k} ne $param->{$k}) {
1455                     my $msg = "parameter '$k' already define in macro (value = '$rule->{$k}')";
1456                     raise_param_exc({ $k => $msg }) if $verify;
1457                     die "$msg\n";
1458                 }
1459             } else {
1460                 $rule->{$k} = $param->{$k};
1461             }
1462         }
1463         push @$rules, $rule;
1464     }
1465
1466     return $rules;
1467 };
1468
1469 my $rule_env_iface_lookup = {
1470     'ct' => 1,
1471     'vm' => 1,
1472     'group' => 0,
1473     'cluster' => 1,
1474     'host' => 1,
1475 };
1476
1477 sub verify_rule {
1478     my ($rule, $cluster_conf, $fw_conf, $rule_env, $noerr) = @_;
1479
1480     my $allow_groups = $rule_env eq 'group' ? 0 : 1;
1481
1482     my $allow_iface = $rule_env_iface_lookup->{$rule_env};
1483     die "unknown rule_env '$rule_env'\n" if !defined($allow_iface); # should not happen
1484
1485     my $errors = $rule->{errors} || {};
1486
1487     my $error_count = 0;
1488
1489     my $add_error = sub {
1490         my ($param, $msg)  = @_;
1491         chomp $msg;
1492         raise_param_exc({ $param => $msg }) if !$noerr;
1493         $error_count++;
1494         $errors->{$param} = $msg if !$errors->{$param};
1495     };
1496
1497     my $ipversion;
1498     my $set_ip_version = sub {
1499         my $vers = shift;
1500         if ($vers) {
1501             die "detected mixed ipv4/ipv6 adresses in rule\n"
1502                 if $ipversion && ($vers != $ipversion);
1503             $ipversion = $vers;
1504         }
1505     };
1506
1507     my $check_ipset_or_alias_property = sub {
1508         my ($name, $expected_ipversion) = @_;
1509
1510         if (my $value = $rule->{$name}) {
1511             if ($value =~ m/^\+/) {
1512                 if ($value =~ m/^\+(${ipset_name_pattern})$/) {
1513                     &$add_error($name, "no such ipset '$1'")
1514                         if !($cluster_conf->{ipset}->{$1} || ($fw_conf && $fw_conf->{ipset}->{$1}));
1515
1516                 } else {
1517                     &$add_error($name, "invalid ipset name '$value'");
1518                 }
1519             } elsif ($value =~ m/^${ip_alias_pattern}$/){
1520                 my $alias = lc($value);
1521                 &$add_error($name, "no such alias '$value'")
1522                     if !($cluster_conf->{aliases}->{$alias} || ($fw_conf && $fw_conf->{aliases}->{$alias}));
1523                 my $e = $fw_conf ? $fw_conf->{aliases}->{$alias} : undef;
1524                 $e = $cluster_conf->{aliases}->{$alias} if !$e && $cluster_conf;
1525
1526                 &$set_ip_version($e->{ipversion});
1527             }
1528         }
1529     };
1530
1531     my $type = $rule->{type};
1532     my $action = $rule->{action};
1533
1534     &$add_error('type', "missing property") if !$type;
1535     &$add_error('action', "missing property") if !$action;
1536
1537     if ($type) {
1538         if ($type eq  'in' || $type eq 'out') {
1539             &$add_error('action', "unknown action '$action'")
1540                 if $action && ($action !~ m/^(ACCEPT|DROP|REJECT)$/);
1541         } elsif ($type eq 'group') {
1542             &$add_error('type', "security groups not allowed")
1543                 if !$allow_groups;
1544             &$add_error('action', "invalid characters in security group name")
1545                 if $action && ($action !~ m/^${security_group_name_pattern}$/);
1546         } else {
1547             &$add_error('type', "unknown rule type '$type'");
1548         }
1549     }
1550
1551     if ($rule->{iface}) {
1552         &$add_error('type', "parameter -i not allowed for this rule type")
1553             if !$allow_iface;
1554         eval { PVE::JSONSchema::pve_verify_iface($rule->{iface}); };
1555         &$add_error('iface', $@) if $@;
1556         if ($rule_env eq 'vm' || $rule_env eq 'ct') {
1557             &$add_error('iface', "value does not match the regex pattern 'net\\d+'")
1558                 if $rule->{iface} !~  m/^net(\d+)$/;
1559         }
1560     }
1561
1562     if ($rule->{macro}) {
1563         if (my $preferred_name = $pve_fw_preferred_macro_names->{lc($rule->{macro})}) {
1564             $rule->{macro} = $preferred_name;
1565         } else {
1566             &$add_error('macro', "unknown macro '$rule->{macro}'");
1567         }
1568     }
1569
1570     if ($rule->{proto}) {
1571         eval { pve_fw_verify_protocol_spec($rule->{proto}); };
1572         &$add_error('proto', $@) if $@;
1573         &$set_ip_version(4) if $rule->{proto} eq 'icmp';
1574         &$set_ip_version(6) if $rule->{proto} eq 'icmpv6';
1575     }
1576
1577     if ($rule->{dport}) {
1578         eval { parse_port_name_number_or_range($rule->{dport}, 1); };
1579         &$add_error('dport', $@) if $@;
1580         my $proto = $rule->{proto};
1581         &$add_error('proto', "missing property - 'dport' requires this property")
1582             if !$proto;
1583         &$add_error('dport', "protocol '$proto' does not support ports")
1584             if !$PROTOCOLS_WITH_PORTS->{$proto} &&
1585                 $proto ne 'icmp' && $proto ne 'icmpv6'; # special cases
1586     }
1587
1588     if ($rule->{sport}) {
1589         eval { parse_port_name_number_or_range($rule->{sport}, 0); };
1590         &$add_error('sport', $@) if $@;
1591         my $proto = $rule->{proto};
1592         &$add_error('proto', "missing property - 'sport' requires this property")
1593             if !$proto;
1594         &$add_error('sport', "protocol '$proto' does not support ports")
1595             if !$PROTOCOLS_WITH_PORTS->{$proto};
1596     }
1597
1598     if ($rule->{source}) {
1599         eval { 
1600             my $source_ipversion = parse_address_list($rule->{source});
1601             &$set_ip_version($source_ipversion);
1602         };
1603         &$add_error('source', $@) if $@;
1604         &$check_ipset_or_alias_property('source', $ipversion);
1605     }
1606
1607     if ($rule->{dest}) {
1608         eval { 
1609             my $dest_ipversion = parse_address_list($rule->{dest}); 
1610             &$set_ip_version($dest_ipversion);
1611         };
1612         &$add_error('dest', $@) if $@;
1613         &$check_ipset_or_alias_property('dest', $ipversion);
1614     }
1615
1616     $rule->{ipversion} = $ipversion if $ipversion;
1617
1618     if ($rule->{macro} && !$error_count) {
1619         eval { &$apply_macro($rule->{macro}, $rule, 1, $ipversion); };
1620         if (my $err = $@) {
1621             if (ref($err) eq "PVE::Exception" && $err->{errors}) {
1622                 my $eh = $err->{errors};
1623                 foreach my $p (keys %$eh) {
1624                     &$add_error($p, $eh->{$p});
1625                 }
1626             } else {
1627                 &$add_error('macro', "$err");
1628             }
1629         }
1630     }
1631
1632     $rule->{errors} = $errors if $error_count;
1633
1634     return $rule;
1635 }
1636
1637 sub copy_rule_data {
1638     my ($rule, $param) = @_;
1639
1640     foreach my $k (keys %$rule_properties) {
1641         if (defined(my $v = $param->{$k})) {
1642             if ($v eq '' || $v eq '-') {
1643                 delete $rule->{$k};
1644             } else {
1645                 $rule->{$k} = $v;
1646             }
1647         }
1648     }
1649
1650     return $rule;
1651 }
1652
1653 sub rules_modify_permissions {
1654     my ($rule_env) = @_;
1655
1656     if ($rule_env eq 'host') {
1657         return {
1658             check => ['perm', '/nodes/{node}', [ 'Sys.Modify' ]],
1659         };
1660     } elsif ($rule_env eq 'cluster' || $rule_env eq 'group') {
1661         return {
1662             check => ['perm', '/', [ 'Sys.Modify' ]],
1663         };
1664     } elsif ($rule_env eq 'vm' || $rule_env eq 'ct') {
1665         return {
1666             check => ['perm', '/vms/{vmid}', [ 'VM.Config.Network' ]],
1667         }
1668     }
1669
1670     return undef;
1671 }
1672
1673 sub rules_audit_permissions {
1674     my ($rule_env) = @_;
1675
1676     if ($rule_env eq 'host') {
1677         return {
1678             check => ['perm', '/nodes/{node}', [ 'Sys.Audit' ]],
1679         };
1680     } elsif ($rule_env eq 'cluster' || $rule_env eq 'group') {
1681         return {
1682             check => ['perm', '/', [ 'Sys.Audit' ]],
1683         };
1684     } elsif ($rule_env eq 'vm' || $rule_env eq 'ct') {
1685         return {
1686             check => ['perm', '/vms/{vmid}', [ 'VM.Audit' ]],
1687         }
1688     }
1689
1690     return undef;
1691 }
1692
1693 # core functions
1694 my $bridge_firewall_enabled = 0;
1695
1696 sub enable_bridge_firewall {
1697
1698     return if $bridge_firewall_enabled; # only once
1699
1700     PVE::ProcFSTools::write_proc_entry("/proc/sys/net/bridge/bridge-nf-call-iptables", "1");
1701     PVE::ProcFSTools::write_proc_entry("/proc/sys/net/bridge/bridge-nf-call-ip6tables", "1");
1702
1703     # make sure syncookies are enabled (which is default on newer 3.X kernels anyways)
1704     PVE::ProcFSTools::write_proc_entry("/proc/sys/net/ipv4/tcp_syncookies", "1");
1705
1706     $bridge_firewall_enabled = 1;
1707 }
1708
1709 sub iptables_restore_cmdlist {
1710     my ($cmdlist) = @_;
1711
1712     run_command("/sbin/iptables-restore -n", input => $cmdlist, errmsg => "iptables_restore_cmdlist");
1713 }
1714
1715 sub ip6tables_restore_cmdlist {
1716     my ($cmdlist) = @_;
1717
1718     run_command("/sbin/ip6tables-restore -n", input => $cmdlist, errmsg => "iptables_restore_cmdlist");
1719 }
1720
1721 sub ipset_restore_cmdlist {
1722     my ($cmdlist) = @_;
1723
1724     run_command("/sbin/ipset restore", input => $cmdlist, errmsg => "ipset_restore_cmdlist");
1725 }
1726
1727 sub ebtables_restore_cmdlist {
1728     my ($cmdlist) = @_;
1729
1730     run_command("/sbin/ebtables-restore", input => $cmdlist, errmsg => "ebtables_restore_cmdlist");
1731 }
1732
1733 sub iptables_get_chains {
1734     my ($iptablescmd) = @_;
1735
1736     $iptablescmd = "iptables" if !$iptablescmd;
1737
1738     my $res = {};
1739
1740     # check what chains we want to track
1741     my $is_pvefw_chain = sub {
1742         my $name = shift;
1743
1744         return 1 if $name =~ m/^PVEFW-\S+$/;
1745
1746         return 1 if $name =~ m/^tap\d+i\d+-(?:IN|OUT)$/;
1747
1748         return 1 if $name =~ m/^veth\d+i\d+-(?:IN|OUT)$/;
1749
1750         return 1 if $name =~ m/^fwbr\d+(v\d+)?-(?:FW|IN|OUT|IPS)$/;
1751         return 1 if $name =~ m/^GROUP-(?:$security_group_name_pattern)-(?:IN|OUT)$/;
1752
1753         return undef;
1754     };
1755
1756     my $table = '';
1757
1758     my $hooks = {};
1759
1760     my $parser = sub {
1761         my $line = shift;
1762
1763         return if $line =~ m/^#/;
1764         return if $line =~ m/^\s*$/;
1765
1766         if ($line =~ m/^\*(\S+)$/) {
1767             $table = $1;
1768             return;
1769         }
1770
1771         return if $table ne 'filter';
1772
1773         if ($line =~ m/^:(\S+)\s/) {
1774             my $chain = $1;
1775             return if !&$is_pvefw_chain($chain);
1776             $res->{$chain} = "unknown";
1777         } elsif ($line =~ m/^-A\s+(\S+)\s.*--comment\s+\"PVESIG:(\S+)\"/) {
1778             my ($chain, $sig) = ($1, $2);
1779             return if !&$is_pvefw_chain($chain);
1780             $res->{$chain} = $sig;
1781         } elsif ($line =~ m/^-A\s+(INPUT|OUTPUT|FORWARD)\s+-j\s+PVEFW-\1$/) {
1782             $hooks->{$1} = 1;
1783         } else {
1784             # simply ignore the rest
1785             return;
1786         }
1787     };
1788
1789     run_command("/sbin/$iptablescmd-save", outfunc => $parser);
1790
1791     return wantarray ? ($res, $hooks) : $res;
1792 }
1793
1794 sub iptables_chain_digest {
1795     my ($rules) = @_;
1796     my $digest = Digest::SHA->new('sha1');
1797     foreach my $rule (@$rules) { # order is important
1798         $digest->add($rule);
1799     }
1800     return $digest->b64digest;
1801 }
1802
1803 sub ipset_chain_digest {
1804     my ($rules) = @_;
1805
1806     my $digest = Digest::SHA->new('sha1');
1807     foreach my $rule (sort @$rules) { # note: sorted
1808         $digest->add($rule);
1809     }
1810     return $digest->b64digest;
1811 }
1812
1813 sub ipset_get_chains {
1814
1815     my $res = {};
1816     my $chains = {};
1817
1818     my $parser = sub {
1819         my $line = shift;
1820
1821         return if $line =~ m/^#/;
1822         return if $line =~ m/^\s*$/;
1823         if ($line =~ m/^(?:\S+)\s(PVEFW-\S+)\s(?:\S+).*/) {
1824             my $chain = $1;
1825             $line =~ s/\s+$//; # delete trailing white space
1826             push @{$chains->{$chain}}, $line;
1827         } else {
1828             # simply ignore the rest
1829             return;
1830         }
1831     };
1832
1833     run_command("/sbin/ipset save", outfunc => $parser);
1834
1835     # compute digest for each chain
1836     foreach my $chain (keys %$chains) {
1837         $res->{$chain} = ipset_chain_digest($chains->{$chain});
1838     }
1839
1840     return $res;
1841 }
1842
1843 sub ebtables_get_chains {
1844
1845     my $res = {};
1846     my $chains = {};
1847     my $parser = sub {
1848         my $line = shift;
1849         return if $line =~ m/^#/;
1850         return if $line =~ m/^\s*$/;
1851         if ($line =~ m/^:(\S+)\s\S+$/) {
1852             # Make sure we know chains exist even if they're empty.
1853             $chains->{$1} //= [];
1854         } elsif ($line =~ m/^(?:\S+)\s(\S+)\s(?:\S+).*/) {
1855             my $chain = $1;
1856             $line =~ s/\s+$//;
1857             push @{$chains->{$chain}}, $line;
1858         } else {
1859             # simply ignore the rest
1860             return;
1861         }
1862     };
1863
1864     run_command("/sbin/ebtables-save", outfunc => $parser);
1865     # compute digest for each chain and store rules as well
1866     foreach my $chain (keys %$chains) {
1867         $res->{$chain}->{rules} = $chains->{$chain};
1868         $res->{$chain}->{sig} = iptables_chain_digest($chains->{$chain});
1869     }
1870     return $res;
1871 }
1872
1873 # substitude action of rule according to action hash
1874 sub rule_substitude_action {
1875     my ($rule, $actions) = @_;
1876
1877     if (my $action = $rule->{action}) {
1878         $rule->{action} = $actions->{$action} if defined($actions->{$action});
1879     }
1880 }
1881
1882 # generate a src or dst match
1883 # $dir(ection) is either d or s
1884 sub ipt_gen_src_or_dst_match {
1885     my ($adr, $dir, $ipversion, $cluster_conf, $fw_conf) = @_;
1886
1887     my $srcdst;
1888     if ($dir eq 's') {
1889         $srcdst = "src";
1890     } elsif ($dir eq 'd') {
1891         $srcdst = "dst";
1892     } else {
1893         die "ipt_gen_src_or_dst_match: invalid direction $dir \n";
1894     }
1895
1896     my $match;
1897     if ($adr =~ m/^\+/) {
1898         if ($adr =~ m/^\+(${ipset_name_pattern})$/) {
1899             my $name = $1;
1900             my $ipset_chain;
1901             if ($fw_conf && $fw_conf->{ipset}->{$name}) {
1902                 $ipset_chain = compute_ipset_chain_name($fw_conf->{vmid}, $name, $ipversion);
1903             } elsif ($cluster_conf && $cluster_conf->{ipset}->{$name}) {
1904                 $ipset_chain = compute_ipset_chain_name(0, $name, $ipversion);
1905             } else {
1906                 die "no such ipset '$name'\n";
1907             }
1908             $match = "-m set --match-set ${ipset_chain} ${srcdst}";
1909         } else {
1910             die "invalid security group name '$adr'\n";
1911         }
1912     } elsif ($adr =~ m/^${ip_alias_pattern}$/){
1913         my $alias = lc($adr);
1914         my $e = $fw_conf ? $fw_conf->{aliases}->{$alias} : undef;
1915         $e = $cluster_conf->{aliases}->{$alias} if !$e && $cluster_conf;
1916         die "no such alias '$adr'\n" if !$e;
1917         $match = "-${dir} $e->{cidr}";
1918     } elsif ($adr =~ m/\-/){
1919         $match = "-m iprange --${srcdst}-range $adr";
1920     } else {
1921         $match = "-${dir} $adr";
1922     }
1923
1924     return $match;
1925 }
1926
1927 # convert a %rule to an array of iptables commands
1928 sub ipt_rule_to_cmds {
1929     my ($rule, $chain, $ipversion, $cluster_conf, $fw_conf, $vmid) = @_;
1930
1931     die "ipt_rule_to_cmds unable to handle macro" if $rule->{macro}; #should not happen
1932
1933     my @match = ();
1934
1935     if (defined $rule->{match}) {
1936         push @match, $rule->{match};
1937     } else {
1938         push @match, "-i $rule->{iface_in}" if $rule->{iface_in};
1939         push @match, "-o $rule->{iface_out}" if $rule->{iface_out};
1940
1941         if ($rule->{source}) {
1942             push @match, ipt_gen_src_or_dst_match($rule->{source}, 's', $ipversion, $cluster_conf, $fw_conf);
1943         }
1944         if ($rule->{dest}) {
1945             push @match, ipt_gen_src_or_dst_match($rule->{dest}, 'd', $ipversion, $cluster_conf, $fw_conf);
1946         }
1947
1948         if (my $proto = $rule->{proto}) {
1949             push @match, "-p $proto";
1950
1951             my $multidport = defined($rule->{dport}) && parse_port_name_number_or_range($rule->{dport}, 1);
1952             my $multisport = defined($rule->{sport}) && parse_port_name_number_or_range($rule->{sport}, 0);
1953
1954             my $add_dport = sub {
1955                 return if !$rule->{dport};
1956
1957                 if ($proto eq 'icmp') {
1958                     # Note: we use dport to store --icmp-type
1959                     die "unknown icmp-type '$rule->{dport}'\n"
1960                         if $rule->{dport} !~ /^\d+$/ && !defined($icmp_type_names->{$rule->{dport}});
1961                     push @match, "-m icmp --icmp-type $rule->{dport}";
1962                 } elsif ($proto eq 'icmpv6') {
1963                     # Note: we use dport to store --icmpv6-type
1964                     die "unknown icmpv6-type '$rule->{dport}'\n"
1965                         if $rule->{dport} !~ /^\d+$/ && !defined($icmpv6_type_names->{$rule->{dport}});
1966                     push @match, "-m icmpv6 --icmpv6-type $rule->{dport}";
1967                 } elsif (!$PROTOCOLS_WITH_PORTS->{$proto}) {
1968                     die "protocol $proto does not have ports\n";
1969                 } elsif ($multidport) {
1970                     push @match, "--match multiport", "--dports $rule->{dport}";
1971                 } else {
1972                     push @match, "--dport $rule->{dport}";
1973                 }
1974             };
1975
1976             my $add_sport = sub {
1977                 return if !$rule->{sport};
1978
1979                 die "protocol $proto does not have ports\n"
1980                     if !$PROTOCOLS_WITH_PORTS->{$proto};
1981                 if ($multisport) {
1982                     push @match, "--match multiport", "--sports $rule->{sport}";
1983                 } else {
1984                     push @match, "--sport $rule->{sport}";
1985                 }
1986             };
1987
1988             # order matters - single port before multiport!
1989             $add_dport->() if $multisport;
1990             $add_sport->();
1991             $add_dport->() if !$multisport;
1992         } elsif ($rule->{dport} || $rule->{sport}) {
1993             die "destination port '$rule->{dport}', but no protocol specified\n" if $rule->{dport};
1994             die "source port '$rule->{sport}', but no protocol specified\n" if $rule->{sport};
1995         }
1996
1997         push @match, "-m addrtype --dst-type $rule->{dsttype}" if $rule->{dsttype};
1998     }
1999     my $matchstr = scalar(@match) ? join(' ', @match) : "";
2000
2001     my $targetstr;
2002     if (defined $rule->{target}) {
2003         $targetstr = $rule->{target};
2004     } else {
2005         my $action = (defined $rule->{action}) ? $rule->{action} : "";
2006         my $goto = 1 if $action eq 'PVEFW-SET-ACCEPT-MARK';
2007         $targetstr = ($goto) ? "-g $action" : "-j $action";
2008     }
2009
2010     my @iptcmds;
2011     if (defined $rule->{log} && $rule->{log}) {
2012         my $logaction = get_log_rule_base($chain, $vmid, $rule->{logmsg}, $rule->{log});
2013         push @iptcmds, "-A $chain $matchstr $logaction";
2014     }
2015     push @iptcmds, "-A $chain $matchstr $targetstr";
2016     return @iptcmds;
2017 }
2018
2019 sub ruleset_generate_rule {
2020     my ($ruleset, $chain, $ipversion, $rule, $cluster_conf, $fw_conf) = @_;
2021
2022     my $rules;
2023
2024     if ($rule->{macro}) {
2025         $rules = &$apply_macro($rule->{macro}, $rule, 0, $ipversion);
2026     } else {
2027         $rules = [ $rule ];
2028     }
2029
2030     # update all or nothing
2031     my @ipt_rule_cmds;
2032     foreach my $r (@$rules) {
2033         push @ipt_rule_cmds, ipt_rule_to_cmds($r, $chain, $ipversion, $cluster_conf, $fw_conf);
2034     }
2035     foreach my $c (@ipt_rule_cmds) {
2036         ruleset_add_ipt_cmd($ruleset, $chain, $c);
2037     }
2038 }
2039
2040 sub ruleset_create_chain {
2041     my ($ruleset, $chain) = @_;
2042
2043     die "Invalid chain name '$chain' (28 char max)\n" if length($chain) > 28;
2044     die "chain name may not contain collons\n" if $chain =~ m/:/; # because of log format
2045
2046     die "chain '$chain' already exists\n" if $ruleset->{$chain};
2047
2048     $ruleset->{$chain} = [];
2049 }
2050
2051 sub ruleset_chain_exist {
2052     my ($ruleset, $chain) = @_;
2053
2054     return $ruleset->{$chain} ? 1 : undef;
2055 }
2056
2057 # add an iptables command (like generated by ipt_rule_to_cmds) to a chain
2058 sub ruleset_add_ipt_cmd {
2059    my ($ruleset, $chain, $iptcmd) = @_;
2060
2061    die "no such chain '$chain'\n" if !$ruleset->{$chain};
2062
2063    push @{$ruleset->{$chain}}, $iptcmd;
2064 }
2065
2066 sub ruleset_addrule {
2067    my ($ruleset, $chain, $match, $action, $log, $logmsg, $vmid) = @_;
2068
2069    die "no such chain '$chain'\n" if !$ruleset->{$chain};
2070
2071    if (defined($log) && $log) {
2072         my $logaction = get_log_rule_base($chain, $vmid, $logmsg, $log);
2073         push @{$ruleset->{$chain}}, "-A $chain $match $logaction";
2074    }
2075    # for stable ebtables digests avoid double-spaces to match ebtables-save output
2076    $match .= ' ' if length($match);
2077    push @{$ruleset->{$chain}}, "-A $chain ${match}$action";
2078 }
2079
2080 sub ruleset_insertrule {
2081    my ($ruleset, $chain, $match, $action, $log) = @_;
2082
2083    die "no such chain '$chain'\n" if !$ruleset->{$chain};
2084
2085    unshift @{$ruleset->{$chain}}, "-A $chain $match $action";
2086 }
2087
2088 sub get_log_rule_base {
2089     my ($chain, $vmid, $msg, $loglevel) = @_;
2090
2091     $vmid = 0 if !defined($vmid);
2092     $msg = "" if !defined($msg);
2093
2094     # Note: we use special format for prefix to pass further
2095     # info to log daemon (VMID, LOGLEVEL and CHAIN)
2096
2097     return "-j NFLOG --nflog-prefix \":$vmid:$loglevel:$chain: $msg\"";
2098 }
2099
2100 sub ruleset_add_chain_policy {
2101     my ($ruleset, $chain, $ipversion, $vmid, $policy, $loglevel, $accept_action) = @_;
2102
2103     if ($policy eq 'ACCEPT') {
2104
2105         my $rule = { action => 'ACCEPT' };
2106         rule_substitude_action($rule, { ACCEPT =>  $accept_action});
2107         ruleset_generate_rule($ruleset, $chain, $ipversion, $rule);
2108
2109     } elsif ($policy eq 'DROP') {
2110
2111         ruleset_addrule($ruleset, $chain, "", "-j PVEFW-Drop");
2112
2113         ruleset_addrule($ruleset, $chain, "", "-j DROP", $loglevel, "policy $policy: ", $vmid);
2114     } elsif ($policy eq 'REJECT') {
2115         ruleset_addrule($ruleset, $chain, "", "-j PVEFW-Reject");
2116
2117         ruleset_addrule($ruleset, $chain, "", "-g PVEFW-reject", $loglevel, "policy $policy: ", $vmid);
2118     } else {
2119         # should not happen
2120         die "internal error: unknown policy '$policy'";
2121     }
2122 }
2123
2124 sub ruleset_chain_add_ndp {
2125     my ($ruleset, $chain, $ipversion, $options, $direction, $accept) = @_;
2126     return if $ipversion != 6 || (defined($options->{ndp}) && !$options->{ndp});
2127
2128     ruleset_addrule($ruleset, $chain, "-p icmpv6 --icmpv6-type router-solicitation", $accept);
2129     if ($direction ne 'OUT' || $options->{radv}) {
2130         ruleset_addrule($ruleset, $chain, "-p icmpv6 --icmpv6-type router-advertisement", $accept);
2131     }
2132     ruleset_addrule($ruleset, $chain, "-p icmpv6 --icmpv6-type neighbor-solicitation", $accept);
2133     ruleset_addrule($ruleset, $chain, "-p icmpv6 --icmpv6-type neighbor-advertisement", $accept);
2134 }
2135
2136 sub ruleset_chain_add_conn_filters {
2137     my ($ruleset, $chain, $allow_invalid, $accept) = @_;
2138
2139     if (!$allow_invalid) {
2140         ruleset_addrule($ruleset, $chain, "-m conntrack --ctstate INVALID", "-j DROP");
2141     }
2142     ruleset_addrule($ruleset, $chain, "-m conntrack --ctstate RELATED,ESTABLISHED", "-j $accept");
2143 }
2144
2145 sub ruleset_chain_add_input_filters {
2146     my ($ruleset, $chain, $ipversion, $options, $cluster_conf, $loglevel) = @_;
2147
2148     if ($cluster_conf->{ipset}->{blacklist}){
2149         if (!ruleset_chain_exist($ruleset, "PVEFW-blacklist")) {
2150             ruleset_create_chain($ruleset, "PVEFW-blacklist");
2151             ruleset_addrule($ruleset, "PVEFW-blacklist", "", "-j DROP", $loglevel, "DROP: ");
2152         }
2153         my $ipset_chain = compute_ipset_chain_name(0, 'blacklist', $ipversion);
2154         ruleset_addrule($ruleset, $chain, "-m set --match-set ${ipset_chain} src", "-j PVEFW-blacklist");
2155     }
2156
2157     if (!(defined($options->{nosmurfs}) && $options->{nosmurfs} == 0)) {
2158         if ($ipversion == 4) {
2159             ruleset_addrule($ruleset, $chain, "-m conntrack --ctstate INVALID,NEW", "-j PVEFW-smurfs");
2160         }
2161     }
2162
2163     if ($options->{tcpflags}) {
2164         ruleset_addrule($ruleset, $chain, "-p tcp", "-j PVEFW-tcpflags");
2165     }
2166 }
2167
2168 sub ruleset_create_vm_chain {
2169     my ($ruleset, $chain, $ipversion, $options, $macaddr, $ipfilter_ipset, $direction) = @_;
2170
2171     ruleset_create_chain($ruleset, $chain);
2172     my $accept = generate_nfqueue($options);
2173
2174     if (!(defined($options->{dhcp}) && $options->{dhcp} == 0)) {
2175         if ($ipversion == 4) {
2176             if ($direction eq 'OUT') {
2177                 ruleset_generate_rule($ruleset, $chain, $ipversion, 
2178                                       { action => 'PVEFW-SET-ACCEPT-MARK',
2179                                         proto => 'udp', sport => 68, dport => 67 });
2180             } else {
2181                 ruleset_generate_rule($ruleset, $chain, $ipversion,
2182                                       { action => 'ACCEPT',
2183                                         proto => 'udp', sport => 67, dport => 68 });
2184             }
2185         } elsif ($ipversion == 6) {
2186             if ($direction eq 'OUT') {
2187                 ruleset_generate_rule($ruleset, $chain, $ipversion,
2188                                       { action => 'PVEFW-SET-ACCEPT-MARK',
2189                                         proto => 'udp', sport => 546, dport => 547 });
2190             } else {
2191                 ruleset_generate_rule($ruleset, $chain, $ipversion,
2192                                       { action => 'ACCEPT',
2193                                         proto => 'udp', sport => 547, dport => 546 });
2194             }
2195         }
2196
2197     }
2198
2199     if ($direction eq 'OUT') {
2200         if (defined($macaddr) && !(defined($options->{macfilter}) && $options->{macfilter} == 0)) {
2201             ruleset_addrule($ruleset, $chain, "-m mac ! --mac-source $macaddr", "-j DROP");
2202         }
2203         if ($ipversion == 6 && !$options->{radv}) {
2204             ruleset_addrule($ruleset, $chain, "-p icmpv6 --icmpv6-type router-advertisement", "-j DROP");
2205         }
2206         if ($ipfilter_ipset) {
2207             ruleset_addrule($ruleset, $chain, "-m set ! --match-set $ipfilter_ipset src", "-j DROP");
2208         }
2209         ruleset_addrule($ruleset, $chain, "", "-j MARK --set-mark $FWACCEPTMARK_OFF"); # clear mark
2210     }
2211
2212     my $accept_action = $direction eq 'OUT' ? '-g PVEFW-SET-ACCEPT-MARK' : "-j $accept";
2213     ruleset_chain_add_ndp($ruleset, $chain, $ipversion, $options, $direction, $accept_action);
2214 }
2215
2216 sub ruleset_add_group_rule {
2217     my ($ruleset, $cluster_conf, $chain, $rule, $direction, $action, $ipversion) = @_;
2218
2219     my $group = $rule->{action};
2220     my $group_chain = "GROUP-$group-$direction";
2221     if(!ruleset_chain_exist($ruleset, $group_chain)){
2222         generate_group_rules($ruleset, $cluster_conf, $group, $ipversion);
2223     }
2224
2225     if ($direction eq 'OUT' && $rule->{iface_out}) {
2226         ruleset_addrule($ruleset, $chain, "-o $rule->{iface_out}", "-j $group_chain");
2227     } elsif ($direction eq 'IN' && $rule->{iface_in}) {
2228         ruleset_addrule($ruleset, $chain, "-i $rule->{iface_in}", "-j $group_chain");
2229     } else {
2230         ruleset_addrule($ruleset, $chain, "", "-j $group_chain");
2231     }
2232
2233     ruleset_addrule($ruleset, $chain, "-m mark --mark $FWACCEPTMARK_ON", "-j $action");
2234 }
2235
2236 sub ruleset_generate_vm_rules {
2237     my ($ruleset, $rules, $cluster_conf, $vmfw_conf, $chain, $netid, $direction, $options, $ipversion) = @_;
2238
2239     my $lc_direction = lc($direction);
2240
2241     my $in_accept = generate_nfqueue($options);
2242
2243     foreach my $rule (@$rules) {
2244         next if $rule->{iface} && $rule->{iface} ne $netid;
2245         next if !$rule->{enable} || $rule->{errors};
2246         next if $rule->{ipversion} && ($rule->{ipversion} != $ipversion);
2247
2248         if ($rule->{type} eq 'group') {
2249             ruleset_add_group_rule($ruleset, $cluster_conf, $chain, $rule, $direction,
2250                                    $direction eq 'OUT' ? 'RETURN' : $in_accept, $ipversion);
2251         } else {
2252             next if $rule->{type} ne $lc_direction;
2253             eval {
2254                 if ($direction eq 'OUT') {
2255                     rule_substitude_action($rule, { ACCEPT => "PVEFW-SET-ACCEPT-MARK", REJECT => "PVEFW-reject" });
2256                     ruleset_generate_rule($ruleset, $chain, $ipversion, $rule, $cluster_conf, $vmfw_conf);
2257                 } else {
2258                     rule_substitude_action($rule, { ACCEPT => $in_accept , REJECT => "PVEFW-reject" });
2259                     ruleset_generate_rule($ruleset, $chain, $ipversion, $rule, $cluster_conf, $vmfw_conf);
2260                 }
2261             };
2262             warn $@ if $@;
2263         }
2264     }
2265 }
2266
2267 sub generate_nfqueue {
2268     my ($options) = @_;
2269
2270     if ($options->{ips}) {
2271         my $action = "NFQUEUE";
2272         if ($options->{ips_queues} && $options->{ips_queues} =~ m/^(\d+)(:(\d+))?$/) {
2273             if (defined($3) && defined($1)) {
2274                 $action .= " --queue-balance $1:$3";
2275             } elsif (defined($1)) {
2276                 $action .= " --queue-num $1";
2277             }
2278         }
2279         $action .= " --queue-bypass" if $feature_ipset_nomatch; #need kernel 3.10
2280         return $action;
2281     } else {
2282         return "ACCEPT";
2283     }
2284 }
2285
2286 sub ruleset_generate_vm_ipsrules {
2287     my ($ruleset, $options, $direction, $iface) = @_;
2288
2289     if ($options->{ips} && $direction eq 'IN') {
2290         my $nfqueue = generate_nfqueue($options);
2291
2292         if (!ruleset_chain_exist($ruleset, "PVEFW-IPS")) {
2293             ruleset_create_chain($ruleset, "PVEFW-IPS");
2294         }
2295
2296         ruleset_addrule($ruleset, "PVEFW-IPS", "-m physdev --physdev-out $iface --physdev-is-bridged", "-j $nfqueue");
2297     }
2298 }
2299
2300 sub generate_tap_rules_direction {
2301     my ($ruleset, $cluster_conf, $iface, $netid, $macaddr, $vmfw_conf, $vmid, $direction, $ipversion) = @_;
2302
2303     my $lc_direction = lc($direction);
2304
2305     my $rules = $vmfw_conf->{rules};
2306
2307     my $options = $vmfw_conf->{options};
2308     my $loglevel = get_option_log_level($options, "log_level_${lc_direction}");
2309
2310     my $tapchain = "$iface-$direction";
2311
2312     my $ipfilter_name = compute_ipfilter_ipset_name($netid);
2313     my $ipfilter_ipset = compute_ipset_chain_name($vmid, $ipfilter_name, $ipversion)
2314         if $options->{ipfilter} || $vmfw_conf->{ipset}->{$ipfilter_name};
2315
2316     # create chain with mac and ip filter
2317     ruleset_create_vm_chain($ruleset, $tapchain, $ipversion, $options, $macaddr, $ipfilter_ipset, $direction);
2318
2319     if ($options->{enable}) {
2320         ruleset_generate_vm_rules($ruleset, $rules, $cluster_conf, $vmfw_conf, $tapchain, $netid, $direction, $options, $ipversion);
2321
2322         ruleset_generate_vm_ipsrules($ruleset, $options, $direction, $iface);
2323
2324         # implement policy
2325         my $policy;
2326
2327         if ($direction eq 'OUT') {
2328             $policy = $options->{policy_out} || 'ACCEPT'; # allow everything by default
2329         } else {
2330             $policy = $options->{policy_in} || 'DROP'; # allow nothing by default
2331         }
2332
2333         my $accept = generate_nfqueue($options);
2334         my $accept_action = $direction eq 'OUT' ? "PVEFW-SET-ACCEPT-MARK" : $accept;
2335         ruleset_add_chain_policy($ruleset, $tapchain, $ipversion, $vmid, $policy, $loglevel, $accept_action);
2336     } else {
2337         my $accept_action = $direction eq 'OUT' ? "PVEFW-SET-ACCEPT-MARK" : 'ACCEPT';
2338         ruleset_add_chain_policy($ruleset, $tapchain, $ipversion, $vmid, 'ACCEPT', $loglevel, $accept_action);
2339     }
2340
2341     # plug the tap chain to bridge chain
2342     if ($direction eq 'IN') {
2343         ruleset_addrule($ruleset, "PVEFW-FWBR-IN",
2344                         "-m physdev --physdev-is-bridged --physdev-out $iface", "-j $tapchain");
2345     } else {
2346         ruleset_addrule($ruleset, "PVEFW-FWBR-OUT",
2347                         "-m physdev --physdev-is-bridged --physdev-in $iface", "-j $tapchain");
2348     }
2349 }
2350
2351 sub enable_host_firewall {
2352     my ($ruleset, $hostfw_conf, $cluster_conf, $ipversion) = @_;
2353
2354     my $options = $hostfw_conf->{options};
2355     my $cluster_options = $cluster_conf->{options};
2356     my $rules = $hostfw_conf->{rules};
2357     my $cluster_rules = $cluster_conf->{rules};
2358
2359     # host inbound firewall
2360     my $chain = "PVEFW-HOST-IN";
2361     ruleset_create_chain($ruleset, $chain);
2362
2363     my $loglevel = get_option_log_level($options, "log_level_in");
2364
2365     ruleset_addrule($ruleset, $chain, "-i lo", "-j ACCEPT");
2366
2367     ruleset_chain_add_conn_filters($ruleset, $chain, 0, 'ACCEPT');
2368     ruleset_chain_add_ndp($ruleset, $chain, $ipversion, $options, 'IN', '-j RETURN');
2369     ruleset_chain_add_input_filters($ruleset, $chain, $ipversion, $options, $cluster_conf, $loglevel);
2370
2371     # we use RETURN because we need to check also tap rules
2372     my $accept_action = 'RETURN';
2373
2374     ruleset_addrule($ruleset, $chain, "-p igmp", "-j $accept_action"); # important for multicast
2375
2376     # add host rules first, so that cluster wide rules can be overwritten
2377     foreach my $rule (@$rules, @$cluster_rules) {
2378         next if !$rule->{enable} || $rule->{errors};
2379         next if $rule->{ipversion} && ($rule->{ipversion} != $ipversion);
2380
2381         $rule->{iface_in} = $rule->{iface} if $rule->{iface};
2382
2383         eval {
2384             if ($rule->{type} eq 'group') {
2385                 ruleset_add_group_rule($ruleset, $cluster_conf, $chain, $rule, 'IN', $accept_action, $ipversion);
2386             } elsif ($rule->{type} eq 'in') {
2387                 rule_substitude_action($rule, { ACCEPT => $accept_action, REJECT => "PVEFW-reject" });
2388                 ruleset_generate_rule($ruleset, $chain, $ipversion, $rule, $cluster_conf, $hostfw_conf);
2389             }
2390         };
2391         warn $@ if $@;
2392         delete $rule->{iface_in};
2393     }
2394
2395     # allow standard traffic for management ipset (includes cluster network)
2396     my $mngmnt_ipset_chain = compute_ipset_chain_name(0, "management", $ipversion);
2397     my $mngmntsrc = "-m set --match-set ${mngmnt_ipset_chain} src";
2398     ruleset_addrule($ruleset, $chain, "$mngmntsrc -p tcp --dport 8006", "-j $accept_action");  # PVE API
2399     ruleset_addrule($ruleset, $chain, "$mngmntsrc -p tcp --dport 5900:5999", "-j $accept_action");  # PVE VNC Console
2400     ruleset_addrule($ruleset, $chain, "$mngmntsrc -p tcp --dport 3128", "-j $accept_action");  # SPICE Proxy
2401     ruleset_addrule($ruleset, $chain, "$mngmntsrc -p tcp --dport 22", "-j $accept_action");  # SSH
2402
2403     my $localnet = $cluster_conf->{aliases}->{local_network}->{cidr};
2404     my $localnet_ver = $cluster_conf->{aliases}->{local_network}->{ipversion};
2405
2406     # corosync
2407     if ($localnet && ($ipversion == $localnet_ver)) {
2408         my $corosync_rule = "-p udp --dport 5404:5405";
2409         ruleset_addrule($ruleset, $chain, "-s $localnet -d $localnet $corosync_rule", "-j $accept_action");
2410         ruleset_addrule($ruleset, $chain, "-s $localnet -m addrtype --dst-type MULTICAST $corosync_rule", "-j $accept_action");
2411     }
2412
2413     # implement input policy
2414     my $policy = $cluster_options->{policy_in} || 'DROP'; # allow nothing by default
2415     ruleset_add_chain_policy($ruleset, $chain, $ipversion, 0, $policy, $loglevel, $accept_action);
2416
2417     # host outbound firewall
2418     $chain = "PVEFW-HOST-OUT";
2419     ruleset_create_chain($ruleset, $chain);
2420
2421     $loglevel = get_option_log_level($options, "log_level_out");
2422
2423     ruleset_addrule($ruleset, $chain, "-o lo", "-j ACCEPT");
2424
2425     ruleset_chain_add_conn_filters($ruleset, $chain, 0, 'ACCEPT');
2426
2427     # we use RETURN because we may want to check other thigs later
2428     $accept_action = 'RETURN';
2429     ruleset_chain_add_ndp($ruleset, $chain, $ipversion, $options, 'OUT', "-j $accept_action");
2430
2431     ruleset_addrule($ruleset, $chain, "-p igmp", "-j $accept_action"); # important for multicast
2432
2433     # add host rules first, so that cluster wide rules can be overwritten
2434     foreach my $rule (@$rules, @$cluster_rules) {
2435         next if !$rule->{enable} || $rule->{errors};
2436         next if $rule->{ipversion} && ($rule->{ipversion} != $ipversion);
2437
2438         $rule->{iface_out} = $rule->{iface} if $rule->{iface};
2439         eval {
2440             if ($rule->{type} eq 'group') {
2441                 ruleset_add_group_rule($ruleset, $cluster_conf, $chain, $rule, 'OUT', $accept_action, $ipversion);
2442             } elsif ($rule->{type} eq 'out') {
2443                 rule_substitude_action($rule, { ACCEPT => $accept_action, REJECT => "PVEFW-reject" });
2444                 ruleset_generate_rule($ruleset, $chain, $ipversion, $rule, $cluster_conf, $hostfw_conf);
2445             }
2446         };
2447         warn $@ if $@;
2448         delete $rule->{iface_out};
2449     }
2450
2451     # allow standard traffic on cluster network
2452     if ($localnet && ($ipversion == $localnet_ver)) {
2453         ruleset_addrule($ruleset, $chain, "-d $localnet -p tcp --dport 8006", "-j $accept_action");  # PVE API
2454         ruleset_addrule($ruleset, $chain, "-d $localnet -p tcp --dport 22", "-j $accept_action");  # SSH
2455         ruleset_addrule($ruleset, $chain, "-d $localnet -p tcp --dport 5900:5999", "-j $accept_action");  # PVE VNC Console
2456         ruleset_addrule($ruleset, $chain, "-d $localnet -p tcp --dport 3128", "-j $accept_action");  # SPICE Proxy
2457
2458         my $corosync_rule = "-p udp --dport 5404:5405";
2459         ruleset_addrule($ruleset, $chain, "-d $localnet $corosync_rule", "-j $accept_action");
2460         ruleset_addrule($ruleset, $chain, "-m addrtype --dst-type MULTICAST $corosync_rule", "-j $accept_action");
2461     }
2462
2463     # implement output policy
2464     $policy = $cluster_options->{policy_out} || 'ACCEPT'; # allow everything by default
2465     ruleset_add_chain_policy($ruleset, $chain, $ipversion, 0, $policy, $loglevel, $accept_action);
2466
2467     ruleset_addrule($ruleset, "PVEFW-OUTPUT", "", "-j PVEFW-HOST-OUT");
2468     ruleset_addrule($ruleset, "PVEFW-INPUT", "", "-j PVEFW-HOST-IN");
2469 }
2470
2471 sub generate_group_rules {
2472     my ($ruleset, $cluster_conf, $group, $ipversion) = @_;
2473
2474     my $rules = $cluster_conf->{groups}->{$group};
2475
2476     if (!$rules) {
2477         warn "no such security group '$group'\n";
2478         $rules = []; # create empty chain
2479     }
2480
2481     my $chain = "GROUP-${group}-IN";
2482
2483     ruleset_create_chain($ruleset, $chain);
2484     ruleset_addrule($ruleset, $chain, "", "-j MARK --set-mark $FWACCEPTMARK_OFF"); # clear mark
2485
2486     foreach my $rule (@$rules) {
2487         next if $rule->{type} ne 'in';
2488         next if !$rule->{enable} || $rule->{errors};
2489         next if $rule->{ipversion} && $rule->{ipversion} ne $ipversion;
2490         rule_substitude_action($rule, { ACCEPT => "PVEFW-SET-ACCEPT-MARK", REJECT => "PVEFW-reject" });
2491         ruleset_generate_rule($ruleset, $chain, $ipversion, $rule, $cluster_conf);
2492     }
2493
2494     $chain = "GROUP-${group}-OUT";
2495
2496     ruleset_create_chain($ruleset, $chain);
2497     ruleset_addrule($ruleset, $chain, "", "-j MARK --set-mark $FWACCEPTMARK_OFF"); # clear mark
2498
2499     foreach my $rule (@$rules) {
2500         next if $rule->{type} ne 'out';
2501         next if !$rule->{enable} || $rule->{errors};
2502         next if $rule->{ipversion} && $rule->{ipversion} ne $ipversion;
2503         # we use PVEFW-SET-ACCEPT-MARK (Instead of ACCEPT) because we need to
2504         # check also other tap rules later
2505         rule_substitude_action($rule, { ACCEPT => 'PVEFW-SET-ACCEPT-MARK', REJECT => "PVEFW-reject" });
2506         ruleset_generate_rule($ruleset, $chain, $ipversion, $rule, $cluster_conf);
2507     }
2508 }
2509
2510 my $MAX_NETS = 32;
2511 my $valid_netdev_names = {};
2512 for (my $i = 0; $i < $MAX_NETS; $i++)  {
2513     $valid_netdev_names->{"net$i"} = 1;
2514 }
2515
2516 sub get_mark_values {
2517     my ($value, $mask) = @_;
2518     $value = hex($value) if $value =~ /^0x/;
2519     $mask = hex($mask) if defined($mask) && $mask =~ /^0x/;
2520     $mask = 0xffffffff if !defined($mask);
2521     return ($value, $mask);
2522 }
2523
2524 sub parse_fw_rule {
2525     my ($prefix, $line, $cluster_conf, $fw_conf, $rule_env, $verbose) = @_;
2526
2527     my $orig_line = $line;
2528
2529     my $rule = {};
2530
2531     # we can add single line comments to the end of the rule
2532     if ($line =~ s/#\s*(.*?)\s*$//) {
2533         $rule->{comment} = decode('utf8', $1);
2534     }
2535
2536     # we can disable a rule when prefixed with '|'
2537
2538     $rule->{enable} = $line =~ s/^\|// ? 0 : 1;
2539
2540     $line =~ s/^(\S+)\s+(\S+)\s*// ||
2541         die "unable to parse rule: $line\n";
2542
2543     $rule->{type} = lc($1);
2544     $rule->{action} = $2;
2545
2546     if ($rule->{type} eq  'in' || $rule->{type} eq 'out') {
2547         if ($rule->{action} =~ m/^(\S+)\((ACCEPT|DROP|REJECT)\)$/) {
2548             $rule->{macro} = $1;
2549             $rule->{action} = $2;
2550         }
2551     }
2552
2553     while (length($line)) {
2554         if ($line =~ s/^-i (\S+)\s*//) {
2555             $rule->{iface} = $1;
2556             next;
2557         }
2558
2559         last if $rule->{type} eq 'group';
2560
2561         if ($line =~ s/^-p (\S+)\s*//) {
2562             $rule->{proto} = $1;
2563             next;
2564         }
2565
2566         if ($line =~ s/^-dport (\S+)\s*//) {
2567             $rule->{dport} = $1;
2568             next;
2569         }
2570
2571         if ($line =~ s/^-sport (\S+)\s*//) {
2572             $rule->{sport} = $1;
2573             next;
2574         }
2575         if ($line =~ s/^-source (\S+)\s*//) {
2576             $rule->{source} = $1;
2577             next;
2578         }
2579         if ($line =~ s/^-dest (\S+)\s*//) {
2580             $rule->{dest} = $1;
2581             next;
2582         }
2583
2584         last;
2585     }
2586
2587     die "unable to parse rule parameters: $line\n" if length($line);
2588
2589     $rule = verify_rule($rule, $cluster_conf, $fw_conf, $rule_env, 1);
2590     if ($rule->{errors}) {
2591         # The verbose flag really means we're running from the CLI and want
2592         # output on the console - in the other case we really want such errors
2593         # to go into the syslog instead.
2594         my $log = $verbose ? sub { warn @_ } : sub { syslog(err => @_) };
2595         $log->("$prefix - errors in rule parameters: $orig_line\n");
2596         foreach my $p (keys %{$rule->{errors}}) {
2597             $log->("  $p: $rule->{errors}->{$p}\n");
2598         }
2599     }
2600
2601     return $rule;
2602 }
2603
2604 sub verify_ethertype {
2605     my ($value) = @_;
2606     my $types = get_etc_ethertypes();
2607     die "unknown ethernet protocol type: $value\n"
2608         if !defined($types->{byname}->{$value}) &&
2609            !defined($types->{byid}->{$value});
2610 }
2611
2612 sub parse_vmfw_option {
2613     my ($line) = @_;
2614
2615     my ($opt, $value);
2616
2617     my $loglevels = "emerg|alert|crit|err|warning|notice|info|debug|nolog";
2618
2619     if ($line =~ m/^(enable|dhcp|ndp|radv|macfilter|ipfilter|ips):\s*(0|1)\s*$/i) {
2620         $opt = lc($1);
2621         $value = int($2);
2622     } elsif ($line =~ m/^(log_level_in|log_level_out):\s*(($loglevels)\s*)?$/i) {
2623         $opt = lc($1);
2624         $value = $2 ? lc($3) : '';
2625     } elsif ($line =~ m/^(policy_(in|out)):\s*(ACCEPT|DROP|REJECT)\s*$/i) {
2626         $opt = lc($1);
2627         $value = uc($3);
2628     } elsif ($line =~ m/^(ips_queues):\s*((\d+)(:(\d+))?)\s*$/i) {
2629         $opt = lc($1);
2630         $value = $2;
2631     } elsif ($line =~ m/^(layer2_protocols):\s*(((\S+)[,]?)+)\s*$/i) {
2632         $opt = lc($1);
2633         $value = $2;
2634         verify_ethertype($_) foreach split(/\s*,\s*/, $value);
2635     } else {
2636         die "can't parse option '$line'\n"
2637     }
2638
2639     return ($opt, $value);
2640 }
2641
2642 sub parse_hostfw_option {
2643     my ($line) = @_;
2644
2645     my ($opt, $value);
2646
2647     my $loglevels = "emerg|alert|crit|err|warning|notice|info|debug|nolog";
2648
2649     if ($line =~ m/^(enable|nosmurfs|tcpflags|ndp|log_nf_conntrack|nf_conntrack_allow_invalid):\s*(0|1)\s*$/i) {
2650         $opt = lc($1);
2651         $value = int($2);
2652     } elsif ($line =~ m/^(log_level_in|log_level_out|tcp_flags_log_level|smurf_log_level):\s*(($loglevels)\s*)?$/i) {
2653         $opt = lc($1);
2654         $value = $2 ? lc($3) : '';
2655     } elsif ($line =~ m/^(nf_conntrack_max|nf_conntrack_tcp_timeout_established):\s*(\d+)\s*$/i) {
2656         $opt = lc($1);
2657         $value = int($2);
2658     } else {
2659         die "can't parse option '$line'\n"
2660     }
2661
2662     return ($opt, $value);
2663 }
2664
2665 sub parse_clusterfw_option {
2666     my ($line) = @_;
2667
2668     my ($opt, $value);
2669
2670     if ($line =~ m/^(enable):\s*(\d+)\s*$/i) {
2671         $opt = lc($1);
2672         $value = int($2);
2673         if (($value > 1) && ((time() - $value) > 60)) {
2674             $value = 0
2675         }
2676     } elsif ($line =~ m/^(ebtables):\s*(0|1)\s*$/i) {
2677         $opt = lc($1);
2678         $value = int($2);
2679     } elsif ($line =~ m/^(policy_(in|out)):\s*(ACCEPT|DROP|REJECT)\s*$/i) {
2680         $opt = lc($1);
2681         $value = uc($3);
2682     } else {
2683         die "can't parse option '$line'\n"
2684     }
2685
2686     return ($opt, $value);
2687 }
2688
2689 sub resolve_alias {
2690     my ($clusterfw_conf, $fw_conf, $cidr) = @_;
2691
2692     my $alias = lc($cidr);
2693     my $e = $fw_conf ? $fw_conf->{aliases}->{$alias} : undef;
2694     $e = $clusterfw_conf->{aliases}->{$alias} if !$e && $clusterfw_conf;
2695
2696     die "no such alias '$cidr'\n" if !$e;;
2697
2698     return wantarray ? ($e->{cidr}, $e->{ipversion}) : $e->{cidr};
2699 }
2700
2701 sub parse_ip_or_cidr {
2702     my ($cidr) = @_;
2703
2704     my $ipversion;
2705     
2706     if ($cidr =~ m!^(?:$IPV6RE)(/(\d+))?$!) {
2707         $cidr =~ s|/128$||;
2708         $ipversion = 6;
2709     } elsif ($cidr =~ m!^(?:$IPV4RE)(/(\d+))?$!) {
2710         $cidr =~ s|/32$||;
2711         $ipversion = 4;
2712     } else {
2713         die "value does not look like a valid IP address or CIDR network\n";
2714     }
2715
2716     return wantarray ? ($cidr, $ipversion) : $cidr;
2717 }
2718
2719 sub parse_alias {
2720     my ($line) = @_;
2721
2722     # we can add single line comments to the end of the line
2723     my $comment = decode('utf8', $1) if $line =~ s/\s*#\s*(.*?)\s*$//;
2724
2725     if ($line =~ m/^(\S+)\s(\S+)$/) {
2726         my ($name, $cidr) = ($1, $2);
2727         my $ipversion;
2728
2729         ($cidr, $ipversion) = parse_ip_or_cidr($cidr);
2730
2731         my $data = {
2732             name => $name,
2733             cidr => $cidr,
2734             ipversion => $ipversion,
2735         };
2736         $data->{comment} = $comment  if $comment;
2737         return $data;
2738     }
2739
2740     return undef;
2741 }
2742
2743 sub generic_fw_config_parser {
2744     my ($filename, $fh, $verbose, $cluster_conf, $empty_conf, $rule_env) = @_;
2745
2746     my $section;
2747     my $group;
2748
2749     my $res = $empty_conf;
2750
2751     while (defined(my $line = <$fh>)) {
2752         next if $line =~ m/^#/;
2753         next if $line =~ m/^\s*$/;
2754
2755         chomp $line;
2756
2757         my $linenr = $fh->input_line_number();
2758         my $prefix = "$filename (line $linenr)";
2759
2760         if ($empty_conf->{options} && ($line =~ m/^\[options\]$/i)) {
2761             $section = 'options';
2762             next;
2763         }
2764
2765         if ($empty_conf->{aliases} && ($line =~ m/^\[aliases\]$/i)) {
2766             $section = 'aliases';
2767             next;
2768         }
2769
2770         if ($empty_conf->{groups} && ($line =~ m/^\[group\s+(\S+)\]\s*(?:#\s*(.*?)\s*)?$/i)) {
2771             $section = 'groups';
2772             $group = lc($1);
2773             my $comment = $2;
2774             eval {
2775                 die "security group name too long\n" if length($group) > $max_group_name_length;
2776                 die "invalid security group name '$group'\n" if $group !~ m/^${security_group_name_pattern}$/;
2777             };
2778             if (my $err = $@) {
2779                 ($section, $group, $comment) = undef;
2780                 warn "$prefix: $err";
2781                 next;
2782             }
2783             
2784             $res->{$section}->{$group} = [];
2785             $res->{group_comments}->{$group} =  decode('utf8', $comment)
2786                 if $comment;
2787             next;
2788         }
2789
2790         if ($empty_conf->{rules} && ($line =~ m/^\[rules\]$/i)) {
2791             $section = 'rules';
2792             next;
2793         }
2794
2795         if ($empty_conf->{ipset} && ($line =~ m/^\[ipset\s+(\S+)\]\s*(?:#\s*(.*?)\s*)?$/i)) {
2796             $section = 'ipset';
2797             $group = lc($1);
2798             my $comment = $2;
2799             eval {      
2800                 die "ipset name too long\n" if length($group) > $max_ipset_name_length;
2801                 die "invalid ipset name '$group'\n" if $group !~ m/^${ipset_name_pattern}$/;
2802             };
2803             if (my $err = $@) {
2804                 ($section, $group, $comment) = undef;
2805                 warn "$prefix: $err";
2806                 next;
2807             }
2808
2809             $res->{$section}->{$group} = [];
2810             $res->{ipset_comments}->{$group} = decode('utf8', $comment)
2811                 if $comment;
2812             next;
2813         }
2814
2815         if (!$section) {
2816             warn "$prefix: skip line - no section\n";
2817             next;
2818         }
2819
2820         if ($section eq 'options') {
2821             eval {
2822                 my ($opt, $value);
2823                 if ($rule_env eq 'cluster') {
2824                     ($opt, $value) = parse_clusterfw_option($line);
2825                 } elsif ($rule_env eq 'host') {
2826                     ($opt, $value) = parse_hostfw_option($line);
2827                 } else {
2828                     ($opt, $value) = parse_vmfw_option($line);
2829                 }
2830                 $res->{options}->{$opt} = $value;
2831             };
2832             warn "$prefix: $@" if $@;
2833         } elsif ($section eq 'aliases') {
2834             eval {
2835                 my $data = parse_alias($line);
2836                 $res->{aliases}->{lc($data->{name})} = $data;
2837             };
2838             warn "$prefix: $@" if $@;
2839         } elsif ($section eq 'rules') {
2840             my $rule;
2841             eval { $rule = parse_fw_rule($prefix, $line, $cluster_conf, $res, $rule_env, $verbose); };
2842             if (my $err = $@) {
2843                 warn "$prefix: $err";
2844                 next;
2845             }
2846             push @{$res->{$section}}, $rule;
2847         } elsif ($section eq 'groups') {
2848             my $rule;
2849             eval { $rule = parse_fw_rule($prefix, $line, $cluster_conf, undef, 'group', $verbose); };
2850             if (my $err = $@) {
2851                 warn "$prefix: $err";
2852                 next;
2853             }
2854             push @{$res->{$section}->{$group}}, $rule;
2855         } elsif ($section eq 'ipset') {
2856             # we can add single line comments to the end of the rule
2857             my $comment = decode('utf8', $1) if $line =~ s/#\s*(.*?)\s*$//;
2858
2859             $line =~ m/^(\!)?\s*(\S+)\s*$/;
2860             my $nomatch = $1;
2861             my $cidr = $2;
2862             my $errors;
2863
2864             if ($nomatch && !$feature_ipset_nomatch) {
2865                 $errors->{nomatch} = "nomatch not supported by kernel";
2866             }
2867
2868             eval { 
2869                 if ($cidr =~ m/^${ip_alias_pattern}$/) {
2870                     resolve_alias($cluster_conf, $res, $cidr); # make sure alias exists
2871                 } else {
2872                     $cidr = parse_ip_or_cidr($cidr);
2873                 }
2874             };
2875             if (my $err = $@) {
2876                 chomp $err;
2877                 $errors->{cidr} = $err;
2878             }
2879
2880             if ($cidr =~ m!/0+$!) {
2881                 $errors->{cidr} = "a zero prefix is not allowed in ipset entries\n";
2882             }
2883
2884             my $entry = { cidr => $cidr };
2885             $entry->{nomatch} = 1 if $nomatch;
2886             $entry->{comment} = $comment if $comment;
2887             $entry->{errors} =  $errors if $errors;
2888
2889             if ($verbose && $errors) {
2890                 warn "$prefix - errors in ipset '$group': $line\n";
2891                 foreach my $p (keys %{$errors}) {
2892                     warn "  $p: $errors->{$p}\n";
2893                 }
2894             }
2895
2896             push @{$res->{$section}->{$group}}, $entry;
2897         } else {
2898             warn "$prefix: skip line - unknown section\n";
2899             next;
2900         }
2901     }
2902
2903     return $res;
2904 }
2905
2906 sub parse_hostfw_config {
2907     my ($filename, $fh, $cluster_conf, $verbose) = @_;
2908
2909     my $empty_conf = { rules => [], options => {}};
2910
2911     return generic_fw_config_parser($filename, $fh, $verbose, $cluster_conf, $empty_conf, 'host');
2912 }
2913
2914 sub parse_vmfw_config {
2915     my ($filename, $fh, $cluster_conf, $rule_env, $verbose) = @_;
2916
2917     my $empty_conf = {
2918         rules => [],
2919         options => {},
2920         aliases => {},
2921         ipset => {} ,
2922         ipset_comments => {},
2923     };
2924
2925     return generic_fw_config_parser($filename, $fh, $verbose, $cluster_conf, $empty_conf, $rule_env);
2926 }
2927
2928 sub parse_clusterfw_config {
2929     my ($filename, $fh, $verbose) = @_;
2930
2931     my $section;
2932     my $group;
2933
2934     my $empty_conf = {
2935         rules => [],
2936         options => {},
2937         aliases => {},
2938         groups => {},
2939         group_comments => {},
2940         ipset => {} ,
2941         ipset_comments => {},
2942     };
2943
2944     return generic_fw_config_parser($filename, $fh, $verbose, $empty_conf, $empty_conf, 'cluster');
2945 }
2946
2947 sub run_locked {
2948     my ($code, @param) = @_;
2949
2950     my $timeout = 10;
2951
2952     my $res = lock_file($pve_fw_lock_filename, $timeout, $code, @param);
2953
2954     die $@ if $@;
2955
2956     return $res;
2957 }
2958
2959 sub read_local_vm_config {
2960
2961     my $qemu = {};
2962     my $lxc = {};
2963
2964     my $vmdata = { qemu => $qemu, lxc => $lxc };
2965
2966     my $vmlist = PVE::Cluster::get_vmlist();
2967     return $vmdata if !$vmlist || !$vmlist->{ids};
2968     my $ids = $vmlist->{ids};
2969
2970     foreach my $vmid (keys %$ids) {
2971         next if !$vmid; # skip VE0
2972         my $d = $ids->{$vmid};
2973         next if !$d->{node} || $d->{node} ne $nodename;
2974         next if !$d->{type};
2975         if ($d->{type} eq 'qemu') {
2976             if ($have_qemu_server) {
2977                 my $cfspath = PVE::QemuConfig->cfs_config_path($vmid);
2978                 if (my $conf = PVE::Cluster::cfs_read_file($cfspath)) {
2979                     $qemu->{$vmid} = $conf;
2980                 }
2981             }
2982         } elsif ($d->{type} eq 'lxc') {
2983             if ($have_lxc) {
2984                 my $cfspath = PVE::LXC::Config->cfs_config_path($vmid);
2985                 if (my $conf = PVE::Cluster::cfs_read_file($cfspath)) {
2986                     $lxc->{$vmid} = $conf;
2987                 }
2988             }
2989         }
2990     }
2991
2992     return $vmdata;
2993 };
2994
2995 sub load_vmfw_conf {
2996     my ($cluster_conf, $rule_env, $vmid, $dir, $verbose) = @_;
2997
2998     my $vmfw_conf = {};
2999
3000     $dir = $pvefw_conf_dir if !defined($dir);
3001
3002     my $filename = "$dir/$vmid.fw";
3003     if (my $fh = IO::File->new($filename, O_RDONLY)) {
3004         $vmfw_conf = parse_vmfw_config($filename, $fh, $cluster_conf, $rule_env, $verbose);
3005         $vmfw_conf->{vmid} = $vmid;
3006     }
3007
3008     return $vmfw_conf;
3009 }
3010
3011 my $format_rules = sub {
3012     my ($rules, $allow_iface) = @_;
3013
3014     my $raw = '';
3015
3016     foreach my $rule (@$rules) {
3017         if ($rule->{type} eq  'in' || $rule->{type} eq 'out' || $rule->{type} eq 'group') {
3018             $raw .= '|' if defined($rule->{enable}) && !$rule->{enable};
3019             $raw .= uc($rule->{type});
3020             if ($rule->{macro}) {
3021                 $raw .= " $rule->{macro}($rule->{action})";
3022             } else {
3023                 $raw .= " " . $rule->{action};
3024             }
3025             if ($allow_iface && $rule->{iface}) {
3026                 $raw .= " -i $rule->{iface}";
3027             }
3028
3029             if ($rule->{type} ne  'group')  {
3030                 $raw .= " -source $rule->{source}" if $rule->{source};
3031                 $raw .= " -dest $rule->{dest}" if $rule->{dest};
3032                 $raw .= " -p $rule->{proto}" if $rule->{proto};
3033                 $raw .= " -dport $rule->{dport}" if $rule->{dport};
3034                 $raw .= " -sport $rule->{sport}" if $rule->{sport};
3035             }
3036
3037             $raw .= " # " . encode('utf8', $rule->{comment})
3038                 if $rule->{comment} && $rule->{comment} !~ m/^\s*$/;
3039             $raw .= "\n";
3040         } else {
3041             die "unknown rule type '$rule->{type}'";
3042         }
3043     }
3044
3045     return $raw;
3046 };
3047
3048 my $format_options = sub {
3049     my ($options) = @_;
3050
3051     my $raw = '';
3052
3053     $raw .= "[OPTIONS]\n\n";
3054     foreach my $opt (keys %$options) {
3055         $raw .= "$opt: $options->{$opt}\n";
3056     }
3057     $raw .= "\n";
3058
3059     return $raw;
3060 };
3061
3062 my $format_aliases = sub {
3063     my ($aliases) = @_;
3064
3065     my $raw = '';
3066
3067     $raw .= "[ALIASES]\n\n";
3068     foreach my $k (keys %$aliases) {
3069         my $e = $aliases->{$k};
3070         $raw .= "$e->{name} $e->{cidr}";
3071         $raw .= " # " . encode('utf8', $e->{comment})
3072             if $e->{comment} && $e->{comment} !~ m/^\s*$/;
3073         $raw .= "\n";
3074     }
3075     $raw .= "\n";
3076
3077     return $raw;
3078 };
3079
3080 my $format_ipsets = sub {
3081     my ($fw_conf) = @_;
3082     
3083     my $raw = '';
3084
3085     foreach my $ipset (sort keys %{$fw_conf->{ipset}}) {
3086         if (my $comment = $fw_conf->{ipset_comments}->{$ipset}) {
3087             my $utf8comment = encode('utf8', $comment);
3088             $raw .= "[IPSET $ipset] # $utf8comment\n\n";
3089         } else {
3090             $raw .= "[IPSET $ipset]\n\n";
3091         }
3092         my $options = $fw_conf->{ipset}->{$ipset};
3093
3094         my $nethash = {};
3095         foreach my $entry (@$options) {
3096             $nethash->{$entry->{cidr}} = $entry;
3097         }
3098
3099         foreach my $cidr (sort keys %$nethash) {
3100             my $entry = $nethash->{$cidr};
3101             my $line = $entry->{nomatch} ? '!' : '';
3102             $line .= $entry->{cidr};
3103             $line .= " # " . encode('utf8', $entry->{comment})
3104                 if $entry->{comment} && $entry->{comment} !~ m/^\s*$/;
3105             $raw .= "$line\n";
3106         }
3107
3108         $raw .= "\n";
3109     }
3110
3111     return $raw;
3112 };
3113
3114 sub save_vmfw_conf {
3115     my ($vmid, $vmfw_conf) = @_;
3116
3117     my $raw = '';
3118
3119     my $options = $vmfw_conf->{options};
3120     $raw .= &$format_options($options) if $options && scalar(keys %$options);
3121
3122     my $aliases = $vmfw_conf->{aliases};
3123     $raw .= &$format_aliases($aliases) if $aliases && scalar(keys %$aliases);
3124
3125     $raw .= &$format_ipsets($vmfw_conf) if $vmfw_conf->{ipset};
3126
3127     my $rules = $vmfw_conf->{rules} || [];
3128     if ($rules && scalar(@$rules)) {
3129         $raw .= "[RULES]\n\n";
3130         $raw .= &$format_rules($rules, 1);
3131         $raw .= "\n";
3132     }
3133
3134     my $filename = "$pvefw_conf_dir/$vmid.fw";
3135     if ($raw) {
3136         mkdir $pvefw_conf_dir;
3137         PVE::Tools::file_set_contents($filename, $raw);
3138     } else {
3139         unlink $filename;
3140     }
3141 }
3142
3143 sub remove_vmfw_conf {
3144     my ($vmid) = @_;
3145
3146     my $vmfw_conffile = "$pvefw_conf_dir/$vmid.fw";
3147
3148     unlink $vmfw_conffile;
3149 }
3150
3151 sub clone_vmfw_conf {
3152     my ($vmid, $newid) = @_;
3153
3154     my $sourcevm_conffile = "$pvefw_conf_dir/$vmid.fw";
3155     my $clonevm_conffile = "$pvefw_conf_dir/$newid.fw";
3156
3157     if (-f $clonevm_conffile) {
3158         unlink $clonevm_conffile;
3159     }
3160     if (-f $sourcevm_conffile) {
3161         my $data = PVE::Tools::file_get_contents($sourcevm_conffile);
3162         PVE::Tools::file_set_contents($clonevm_conffile, $data);
3163     }
3164 }
3165
3166 sub read_vm_firewall_configs {
3167     my ($cluster_conf, $vmdata, $dir, $verbose) = @_;
3168
3169     my $vmfw_configs = {};
3170
3171     foreach my $vmid (keys %{$vmdata->{qemu}}) {
3172         my $vmfw_conf = load_vmfw_conf($cluster_conf, 'vm', $vmid, $dir, $verbose);
3173         next if !$vmfw_conf->{options}; # skip if file does not exists
3174         $vmfw_configs->{$vmid} = $vmfw_conf;
3175     }
3176     foreach my $vmid (keys %{$vmdata->{lxc}}) {
3177         my $vmfw_conf = load_vmfw_conf($cluster_conf, 'ct', $vmid, $dir, $verbose);
3178         next if !$vmfw_conf->{options}; # skip if file does not exists
3179         $vmfw_configs->{$vmid} = $vmfw_conf;
3180     }
3181
3182     return $vmfw_configs;
3183 }
3184
3185 sub get_option_log_level {
3186     my ($options, $k) = @_;
3187
3188     my $v = $options->{$k};
3189     $v = $default_log_level if !defined($v);
3190
3191     return undef if $v eq '' || $v eq 'nolog';
3192
3193     $v = $log_level_hash->{$v} if defined($log_level_hash->{$v});
3194
3195     return $v if ($v >= 0) && ($v <= 7);
3196
3197     warn "unknown log level ($k = '$v')\n";
3198
3199     return undef;
3200 }
3201
3202 sub generate_std_chains {
3203     my ($ruleset, $options, $ipversion) = @_;
3204
3205     my $std_chains = $pve_std_chains->{$ipversion} || die "internal error";
3206
3207     my $loglevel = get_option_log_level($options, 'smurf_log_level');
3208     my $chain = 'PVEFW-smurflog';
3209     if ( $std_chains->{$chain} ) {
3210         foreach my $r (@{$std_chains->{$chain}}) {
3211           $r->{log} = $loglevel;
3212         }
3213     }
3214
3215     # same as shorewall logflags action.
3216     $loglevel = get_option_log_level($options, 'tcp_flags_log_level');
3217     $chain = 'PVEFW-logflags';
3218     if ( $std_chains->{$chain} ) {
3219         foreach my $r (@{$std_chains->{$chain}}) {
3220           $r->{log} = $loglevel;
3221         }
3222     }
3223
3224     foreach my $chain (keys %$std_chains) {
3225         ruleset_create_chain($ruleset, $chain);
3226         foreach my $rule (@{$std_chains->{$chain}}) {
3227             if (ref($rule)) {
3228                 ruleset_generate_rule($ruleset, $chain, $ipversion, $rule);
3229             } else {
3230                 die "rule $rule as string - should not happen";
3231             }
3232         }
3233     }
3234 }
3235
3236 sub generate_ipset_chains {
3237     my ($ipset_ruleset, $clusterfw_conf, $fw_conf, $device_ips, $ipsets) = @_;
3238
3239     foreach my $ipset (keys %{$ipsets}) {
3240
3241         my $options = $ipsets->{$ipset};
3242
3243         if ($device_ips && $ipset =~ /^ipfilter-(net\d+)$/) {
3244             if (my $ips = $device_ips->{$1}) {
3245                 $options = [@$options, @$ips];
3246             }
3247         }
3248
3249         # remove duplicates
3250         my $nethash = {};
3251         foreach my $entry (@$options) {
3252             next if $entry->{errors}; # skip entries with errors
3253             eval {
3254                 my ($cidr, $ver);
3255                 if ($entry->{cidr} =~ m/^${ip_alias_pattern}$/) {
3256                     ($cidr, $ver) = resolve_alias($clusterfw_conf, $fw_conf, $entry->{cidr});
3257                 } else {
3258                     ($cidr, $ver) = parse_ip_or_cidr($entry->{cidr});
3259                 }
3260                 #http://backreference.org/2013/03/01/ipv6-address-normalization/
3261                 if ($ver == 6) {
3262                     # ip_compress_address takes an address only, no CIDR
3263                     my ($addr, $prefix_len) = ($cidr =~ m@^([^/]*)(/.*)?$@);
3264                     $cidr = lc(Net::IP::ip_compress_address($addr, 6));
3265                     $cidr .= $prefix_len if defined($prefix_len);
3266                     $cidr =~ s|/128$||;
3267                 } else {
3268                     $cidr =~ s|/32$||;
3269                 }
3270
3271                 $nethash->{$ver}->{$cidr} = { cidr => $cidr, nomatch => $entry->{nomatch} };
3272             };
3273             warn $@ if $@;
3274         }
3275
3276         foreach my $ipversion (4, 6) {
3277             my $data = $nethash->{$ipversion};
3278
3279             my $name = compute_ipset_chain_name($fw_conf->{vmid}, $ipset, $ipversion);
3280
3281             my $hashsize = scalar(@$options);
3282             if ($hashsize <= 64) {
3283                 $hashsize = 64;
3284             } else {
3285                 $hashsize = round_powerof2($hashsize);
3286             }
3287
3288             my $family = $ipversion == "6" ? "inet6" : "inet";
3289
3290             $ipset_ruleset->{$name} = ["create $name hash:net family $family hashsize $hashsize maxelem $hashsize"];
3291
3292             foreach my $cidr (sort keys %$data) {
3293                 my $entry = $data->{$cidr};
3294
3295                 my $cmd = "add $name $cidr";
3296                 if ($entry->{nomatch}) {
3297                     if ($feature_ipset_nomatch) {
3298                         push @{$ipset_ruleset->{$name}}, "$cmd nomatch";
3299                     } else {
3300                         warn "ignore !$cidr - nomatch not supported by kernel\n";
3301                     }
3302                 } else {
3303                     push @{$ipset_ruleset->{$name}}, $cmd;
3304                 }
3305             }
3306         }
3307     }
3308 }
3309
3310 sub round_powerof2 {
3311     my ($int) = @_;
3312
3313     $int--;
3314     $int |= $int >> $_ foreach (1,2,4,8,16);
3315     return ++$int;
3316 }
3317
3318 sub load_clusterfw_conf {
3319     my ($filename, $verbose) = @_;
3320
3321     $filename = $clusterfw_conf_filename if !defined($filename);
3322
3323     my $cluster_conf = {};
3324     if (my $fh = IO::File->new($filename, O_RDONLY)) {
3325         $cluster_conf = parse_clusterfw_config($filename, $fh, $verbose);
3326     }
3327
3328     return $cluster_conf;
3329 }
3330
3331 sub save_clusterfw_conf {
3332     my ($cluster_conf) = @_;
3333
3334     my $raw = '';
3335
3336     my $options = $cluster_conf->{options};
3337     $raw .= &$format_options($options) if $options && scalar(keys %$options);
3338
3339     my $aliases = $cluster_conf->{aliases};
3340     $raw .= &$format_aliases($aliases) if $aliases && scalar(keys %$aliases);
3341
3342     $raw .= &$format_ipsets($cluster_conf) if $cluster_conf->{ipset};
3343  
3344     my $rules = $cluster_conf->{rules};
3345     if ($rules && scalar(@$rules)) {
3346         $raw .= "[RULES]\n\n";
3347         $raw .= &$format_rules($rules, 1);
3348         $raw .= "\n";
3349     }
3350
3351     if ($cluster_conf->{groups}) {
3352         foreach my $group (sort keys %{$cluster_conf->{groups}}) {
3353             my $rules = $cluster_conf->{groups}->{$group};
3354             if (my $comment = $cluster_conf->{group_comments}->{$group}) {
3355                 my $utf8comment = encode('utf8', $comment);
3356                 $raw .= "[group $group] # $utf8comment\n\n";
3357             } else {
3358                 $raw .= "[group $group]\n\n";
3359             }
3360
3361             $raw .= &$format_rules($rules, 0);
3362             $raw .= "\n";
3363         }
3364     }
3365
3366     if ($raw) {
3367         mkdir $pvefw_conf_dir;
3368         PVE::Tools::file_set_contents($clusterfw_conf_filename, $raw);
3369     } else {
3370         unlink $clusterfw_conf_filename;
3371     }
3372 }
3373
3374 sub load_hostfw_conf {
3375     my ($cluster_conf, $filename, $verbose) = @_;
3376
3377     $filename = $hostfw_conf_filename if !defined($filename);
3378
3379     my $hostfw_conf = {};
3380     if (my $fh = IO::File->new($filename, O_RDONLY)) {
3381         $hostfw_conf = parse_hostfw_config($filename, $fh, $cluster_conf, $verbose);
3382     }
3383     return $hostfw_conf;
3384 }
3385
3386 sub save_hostfw_conf {
3387     my ($hostfw_conf) = @_;
3388
3389     my $raw = '';
3390
3391     my $options = $hostfw_conf->{options};
3392     $raw .= &$format_options($options) if $options && scalar(keys %$options);
3393
3394     my $rules = $hostfw_conf->{rules};
3395     if ($rules && scalar(@$rules)) {
3396         $raw .= "[RULES]\n\n";
3397         $raw .= &$format_rules($rules, 1);
3398         $raw .= "\n";
3399     }
3400
3401     if ($raw) {
3402         PVE::Tools::file_set_contents($hostfw_conf_filename, $raw);
3403     } else {
3404         unlink $hostfw_conf_filename;
3405     }
3406 }
3407
3408 sub compile {
3409     my ($cluster_conf, $hostfw_conf, $vmdata, $verbose) = @_;
3410
3411     my $vmfw_configs;
3412
3413     # fixme: once we read standard chains from config this needs to be put in test/standard cases below
3414     $pve_std_chains = dclone($pve_std_chains_conf);
3415
3416     if ($vmdata) { # test mode
3417         my $testdir = $vmdata->{testdir} || die "no test directory specified";
3418         my $filename = "$testdir/cluster.fw";
3419         $cluster_conf = load_clusterfw_conf($filename, $verbose);
3420
3421         $filename = "$testdir/host.fw";
3422         $hostfw_conf = load_hostfw_conf($cluster_conf, $filename, $verbose);
3423
3424         $vmfw_configs = read_vm_firewall_configs($cluster_conf, $vmdata, $testdir, $verbose);
3425     } else { # normal operation
3426         $cluster_conf = load_clusterfw_conf(undef, $verbose) if !$cluster_conf;
3427
3428         $hostfw_conf = load_hostfw_conf($cluster_conf, undef, $verbose) if !$hostfw_conf;
3429
3430         $vmdata = read_local_vm_config();
3431         $vmfw_configs = read_vm_firewall_configs($cluster_conf, $vmdata, undef, $verbose);
3432     }
3433
3434     return ({},{},{},{}) if !$cluster_conf->{options}->{enable};
3435
3436     my $localnet;
3437     if ($cluster_conf->{aliases}->{local_network}) {
3438         $localnet = $cluster_conf->{aliases}->{local_network}->{cidr};
3439     } else {
3440         my $localnet_ver;
3441         ($localnet, $localnet_ver) = parse_ip_or_cidr(local_network() || '127.0.0.0/8');
3442
3443         $cluster_conf->{aliases}->{local_network} = {
3444             name => 'local_network', cidr => $localnet, ipversion => $localnet_ver };
3445     }
3446
3447     push @{$cluster_conf->{ipset}->{management}}, { cidr => $localnet };
3448
3449     my $ruleset = compile_iptables_filter($cluster_conf, $hostfw_conf, $vmfw_configs, $vmdata, 4, $verbose);
3450     my $rulesetv6 = compile_iptables_filter($cluster_conf, $hostfw_conf, $vmfw_configs, $vmdata, 6, $verbose);
3451     my $ebtables_ruleset = compile_ebtables_filter($cluster_conf, $hostfw_conf, $vmfw_configs, $vmdata, $verbose);
3452     my $ipset_ruleset = compile_ipsets($cluster_conf, $vmfw_configs, $vmdata);
3453
3454     return ($ruleset, $ipset_ruleset, $rulesetv6, $ebtables_ruleset);
3455 }
3456
3457 sub compile_iptables_filter {
3458     my ($cluster_conf, $hostfw_conf, $vmfw_configs, $vmdata, $ipversion, $verbose) = @_;
3459
3460     my $ruleset = {};
3461
3462     ruleset_create_chain($ruleset, "PVEFW-INPUT");
3463     ruleset_create_chain($ruleset, "PVEFW-OUTPUT");
3464
3465     ruleset_create_chain($ruleset, "PVEFW-FORWARD");
3466
3467     my $hostfw_options = $hostfw_conf->{options} || {};
3468
3469     # fixme: what log level should we use here?
3470     my $loglevel = get_option_log_level($hostfw_options, "log_level_out");
3471
3472     my $conn_allow_invalid = $hostfw_options->{nf_conntrack_allow_invalid} // 0;
3473     ruleset_chain_add_conn_filters($ruleset, "PVEFW-FORWARD", $conn_allow_invalid, "ACCEPT");
3474
3475     ruleset_create_chain($ruleset, "PVEFW-FWBR-IN");
3476     ruleset_chain_add_input_filters($ruleset, "PVEFW-FWBR-IN", $ipversion, $hostfw_options, $cluster_conf, $loglevel);
3477
3478     ruleset_addrule($ruleset, "PVEFW-FORWARD", "-m physdev --physdev-is-bridged --physdev-in fwln+", "-j PVEFW-FWBR-IN");
3479
3480     ruleset_create_chain($ruleset, "PVEFW-FWBR-OUT");
3481     ruleset_addrule($ruleset, "PVEFW-FORWARD", "-m physdev --physdev-is-bridged --physdev-out fwln+", "-j PVEFW-FWBR-OUT");
3482
3483     generate_std_chains($ruleset, $hostfw_options, $ipversion);
3484
3485     my $hostfw_enable = !(defined($hostfw_options->{enable}) && ($hostfw_options->{enable} == 0));
3486
3487     if ($hostfw_enable) {
3488         eval { enable_host_firewall($ruleset, $hostfw_conf, $cluster_conf, $ipversion); };
3489         warn $@ if $@; # just to be sure - should not happen
3490     }
3491
3492     # generate firewall rules for QEMU VMs
3493     foreach my $vmid (sort keys %{$vmdata->{qemu}}) {
3494         eval {
3495             my $conf = $vmdata->{qemu}->{$vmid};
3496             my $vmfw_conf = $vmfw_configs->{$vmid};
3497             return if !$vmfw_conf;
3498
3499             foreach my $netid (sort keys %$conf) {
3500                 next if $netid !~ m/^net(\d+)$/;
3501                 my $net = PVE::QemuServer::parse_net($conf->{$netid});
3502                 next if !$net->{firewall};
3503                 my $iface = "tap${vmid}i$1";
3504
3505                 my $macaddr = $net->{macaddr};
3506                 generate_tap_rules_direction($ruleset, $cluster_conf, $iface, $netid, $macaddr,
3507                                              $vmfw_conf, $vmid, 'IN', $ipversion);
3508                 generate_tap_rules_direction($ruleset, $cluster_conf, $iface, $netid, $macaddr,
3509                                              $vmfw_conf, $vmid, 'OUT', $ipversion);
3510             }
3511         };
3512         warn $@ if $@; # just to be sure - should not happen
3513     }
3514
3515     # generate firewall rules for LXC containers
3516     foreach my $vmid (sort keys %{$vmdata->{lxc}}) {
3517         eval {
3518             my $conf = $vmdata->{lxc}->{$vmid};
3519             my $vmfw_conf = $vmfw_configs->{$vmid};
3520             return if !$vmfw_conf;
3521
3522             if ($vmfw_conf->{options}->{enable}) {
3523                 foreach my $netid (sort keys %$conf) {
3524                     next if $netid !~ m/^net(\d+)$/;
3525                     my $net = PVE::LXC::Config->parse_lxc_network($conf->{$netid});
3526                     next if !$net->{firewall};
3527                     my $iface = "veth${vmid}i$1";
3528                     my $macaddr = $net->{hwaddr};
3529                     generate_tap_rules_direction($ruleset, $cluster_conf, $iface, $netid, $macaddr,
3530                                                  $vmfw_conf, $vmid, 'IN', $ipversion);
3531                     generate_tap_rules_direction($ruleset, $cluster_conf, $iface, $netid, $macaddr,
3532                                                  $vmfw_conf, $vmid, 'OUT', $ipversion);
3533                 }
3534             }
3535         };
3536         warn $@ if $@; # just to be sure - should not happen
3537     }
3538
3539     if(ruleset_chain_exist($ruleset, "PVEFW-IPS")){
3540         ruleset_insertrule($ruleset, "PVEFW-FORWARD", "-m conntrack --ctstate RELATED,ESTABLISHED", "-j PVEFW-IPS");
3541     }
3542
3543     return $ruleset;
3544 }
3545
3546 sub mac_to_linklocal {
3547     my ($macaddr) = @_;
3548     my @parts = split(/:/, $macaddr);
3549     # The standard link local address uses the fe80::/64 prefix with the
3550     # modified EUI-64 identifier derived from the MAC address by flipping the
3551     # universal/local bit and inserting FF:FE in the middle.
3552     # See RFC 4291.
3553     $parts[0] = sprintf("%02x", hex($parts[0]) ^ 0x02);
3554     my @meui64 = (@parts[0,1,2], 'ff', 'fe', @parts[3,4,5]);
3555     return "fe80::$parts[0]$parts[1]:$parts[2]FF:FE$parts[3]:$parts[4]$parts[5]";
3556 }
3557
3558 sub compile_ipsets {
3559     my ($cluster_conf, $vmfw_configs, $vmdata) = @_;
3560
3561     my $localnet;
3562     if ($cluster_conf->{aliases}->{local_network}) {
3563         $localnet = $cluster_conf->{aliases}->{local_network}->{cidr};
3564     } else {
3565         my $localnet_ver;
3566         ($localnet, $localnet_ver) = parse_ip_or_cidr(local_network() || '127.0.0.0/8');
3567
3568         $cluster_conf->{aliases}->{local_network} = {