ef724a7085871580b7bc11807fb29699827561a3
[pve-firewall.git] / src / PVE / Firewall.pm
1 package PVE::Firewall;
2
3 use warnings;
4 use strict;
5
6 use Digest::SHA;
7 use Encode;
8 use File::Basename;
9 use File::Path;
10 use IO::File;
11 use Net::IP;
12 use POSIX;
13 use Socket qw(AF_INET AF_INET6 inet_ntop inet_pton);
14 use Storable qw(dclone);
15
16 use PVE::Cluster;
17 use PVE::Corosync;
18 use PVE::Exception qw(raise raise_param_exc);
19 use PVE::INotify;
20 use PVE::JSONSchema qw(register_standard_option get_standard_option);
21 use PVE::Network;
22 use PVE::ProcFSTools;
23 use PVE::SafeSyslog;
24 use PVE::Tools qw($IPV4RE $IPV6RE);
25 use PVE::Tools qw(run_command lock_file dir_glob_foreach);
26
27 my $pvefw_conf_dir = "/etc/pve/firewall";
28 my $clusterfw_conf_filename = "$pvefw_conf_dir/cluster.fw";
29
30 # dynamically include PVE::QemuServer and PVE::LXC
31 # to avoid dependency problems
32 my $have_qemu_server;
33 eval {
34     require PVE::QemuServer;
35     require PVE::QemuConfig;
36     $have_qemu_server = 1;
37 };
38
39 my $have_lxc;
40 eval {
41     require PVE::LXC;
42     $have_lxc = 1;
43 };
44
45 my $pve_fw_status_dir = "/var/lib/pve-firewall";
46
47 mkdir $pve_fw_status_dir; # make sure this exists
48
49 my $security_group_name_pattern = '[A-Za-z][A-Za-z0-9\-\_]+';
50 my $ipset_name_pattern = '[A-Za-z][A-Za-z0-9\-\_]+';
51 our $ip_alias_pattern = '[A-Za-z][A-Za-z0-9\-\_]+';
52
53 my $max_alias_name_length = 64;
54 my $max_ipset_name_length = 64;
55 my $max_group_name_length = 18;
56
57 my $PROTOCOLS_WITH_PORTS = {
58     udp => 1,     17 => 1,
59     udplite => 1, 136 => 1,
60     tcp => 1,     6 => 1,
61     dccp => 1,    33 => 1,
62     sctp => 1,    132 => 1,
63 };
64
65 PVE::JSONSchema::register_format('IPorCIDR', \&pve_verify_ip_or_cidr);
66 sub pve_verify_ip_or_cidr {
67     my ($cidr, $noerr) = @_;
68
69     if ($cidr =~ m!^(?:$IPV6RE|$IPV4RE)(/(\d+))?$!) {
70         return $cidr if Net::IP->new($cidr);
71         return undef if $noerr;
72         die Net::IP::Error() . "\n";
73     }
74     return undef if $noerr;
75     die "value does not look like a valid IP address or CIDR network\n";
76 }
77
78 PVE::JSONSchema::register_format('IPorCIDRorAlias', \&pve_verify_ip_or_cidr_or_alias);
79 sub pve_verify_ip_or_cidr_or_alias {
80     my ($cidr, $noerr) = @_;
81
82     return if $cidr =~ m/^(?:$ip_alias_pattern)$/;
83
84     return pve_verify_ip_or_cidr($cidr, $noerr);
85 }
86
87 PVE::JSONSchema::register_standard_option('ipset-name', {
88     description => "IP set name.",
89     type => 'string',
90     pattern => $ipset_name_pattern,
91     minLength => 2,
92     maxLength => $max_ipset_name_length,
93 });
94
95 PVE::JSONSchema::register_standard_option('pve-fw-alias', {
96     description => "Alias name.",
97     type => 'string',
98     pattern => $ip_alias_pattern,
99     minLength => 2,
100     maxLength => $max_alias_name_length,
101 });
102
103 PVE::JSONSchema::register_standard_option('pve-fw-loglevel' => {
104     description => "Log level.",
105     type => 'string',
106     enum => ['emerg', 'alert', 'crit', 'err', 'warning', 'notice', 'info', 'debug', 'nolog'],
107     optional => 1,
108 });
109
110 PVE::JSONSchema::register_standard_option('pve-security-group-name', {
111     description => "Security Group name.",
112     type => 'string',
113     pattern => $security_group_name_pattern,
114     minLength => 2,
115     maxLength => $max_group_name_length,
116 });
117
118 my $feature_ipset_nomatch = 0;
119 eval  {
120     my (undef, undef, $release) = POSIX::uname();
121     if ($release =~ m/^(\d+)\.(\d+)\.\d+-/) {
122         my ($major, $minor) = ($1, $2);
123         $feature_ipset_nomatch = 1 if ($major > 3) ||
124             ($major == 3 && $minor >= 7);
125     }
126
127 };
128
129 my $nodename = PVE::INotify::nodename();
130 my $hostfw_conf_filename = "/etc/pve/nodes/$nodename/host.fw";
131
132 my $pve_fw_lock_filename = "/var/lock/pvefw.lck";
133
134 my $default_log_level = 'nolog'; # avoid logs by default
135 my $global_log_ratelimit = '--limit 1/sec';
136
137 my $log_level_hash = {
138     debug => 7,
139     info => 6,
140     notice => 5,
141     warning => 4,
142     err => 3,
143     crit => 2,
144     alert => 1,
145     emerg => 0,
146 };
147
148 my $verbose = 0;
149 sub set_verbose {
150     $verbose = shift;
151 }
152
153 # %rule
154 #
155 # name => optional
156 # enable => [0|1]
157 # action =>
158 # proto =>
159 # sport => port[,port[,port]].. or port:port
160 # dport => port[,port[,port]].. or port:port
161 # log => optional, loglevel
162 # logmsg => optional, logmsg - overwrites default
163 # iface_in => incomin interface
164 # iface_out => outgoing interface
165 # match => optional, overwrites generation of match
166 # target => optional, overwrites action
167
168 # we need to overwrite some macros for ipv6
169 my $pve_ipv6fw_macros = {
170     'Ping' => [
171         { action => 'PARAM', proto => 'icmpv6', dport => 'echo-request' },
172     ],
173     'NeighborDiscovery' => [
174         "IPv6 neighbor solicitation, neighbor and router advertisement",
175         { action => 'PARAM', proto => 'icmpv6', dport => 'router-solicitation' },
176         { action => 'PARAM', proto => 'icmpv6', dport => 'router-advertisement' },
177         { action => 'PARAM', proto => 'icmpv6', dport => 'neighbor-solicitation' },
178         { action => 'PARAM', proto => 'icmpv6', dport => 'neighbor-advertisement' },
179     ],
180     'DHCPv6' => [
181         "DHCPv6 traffic",
182         { action => 'PARAM', proto => 'udp', dport => '546:547', sport => '546:547' },
183     ],
184     'Trcrt' => [
185         { action => 'PARAM', proto => 'udp', dport => '33434:33524' },
186         { action => 'PARAM', proto => 'icmpv6', dport => 'echo-request' },
187     ],
188  };
189
190 # imported/converted from: /usr/share/shorewall/macro.*
191 my $pve_fw_macros = {
192     'Amanda' => [
193         "Amanda Backup",
194         { action => 'PARAM', proto => 'udp', dport => '10080' },
195         { action => 'PARAM', proto => 'tcp', dport => '10080' },
196     ],
197     'Auth' => [
198         "Auth (identd) traffic",
199         { action => 'PARAM', proto => 'tcp', dport => '113' },
200     ],
201     'BGP' => [
202         "Border Gateway Protocol traffic",
203         { action => 'PARAM', proto => 'tcp', dport => '179' },
204     ],
205     'BitTorrent' => [
206         "BitTorrent traffic for BitTorrent 3.1 and earlier",
207         { action => 'PARAM', proto => 'tcp', dport => '6881:6889' },
208         { action => 'PARAM', proto => 'udp', dport => '6881' },
209     ],
210     'BitTorrent32' => [
211         "BitTorrent traffic for BitTorrent 3.2 and later",
212         { action => 'PARAM', proto => 'tcp', dport => '6881:6999' },
213         { action => 'PARAM', proto => 'udp', dport => '6881' },
214     ],
215     'Ceph' => [
216         "Ceph Storage Cluster traffic (Ceph Monitors, OSD & MDS Deamons)",
217         { action => 'PARAM', proto => 'tcp', dport => '6789' },
218         { action => 'PARAM', proto => 'tcp', dport => '6800:7300' },
219     ],
220     'CVS' => [
221         "Concurrent Versions System pserver traffic",
222         { action => 'PARAM', proto => 'tcp', dport => '2401' },
223     ],
224     'Citrix' => [
225         "Citrix/ICA traffic (ICA, ICA Browser, CGP)",
226         { action => 'PARAM', proto => 'tcp', dport => '1494' },
227         { action => 'PARAM', proto => 'udp', dport => '1604' },
228         { action => 'PARAM', proto => 'tcp', dport => '2598' },
229     ],
230     'DAAP' => [
231         "Digital Audio Access Protocol traffic (iTunes, Rythmbox daemons)",
232         { action => 'PARAM', proto => 'tcp', dport => '3689' },
233         { action => 'PARAM', proto => 'udp', dport => '3689' },
234     ],
235     'DCC' => [
236         "Distributed Checksum Clearinghouse spam filtering mechanism",
237         { action => 'PARAM', proto => 'tcp', dport => '6277' },
238     ],
239     'DHCPfwd' => [
240         "Forwarded DHCP traffic",
241         { action => 'PARAM', proto => 'udp', dport => '67:68', sport => '67:68' },
242     ],
243     'DNS' => [
244         "Domain Name System traffic (upd and tcp)",
245         { action => 'PARAM', proto => 'udp', dport => '53' },
246         { action => 'PARAM', proto => 'tcp', dport => '53' },
247     ],
248     'Distcc' => [
249         "Distributed Compiler service",
250         { action => 'PARAM', proto => 'tcp', dport => '3632' },
251     ],
252     'FTP' => [
253         "File Transfer Protocol",
254         { action => 'PARAM', proto => 'tcp', dport => '21' },
255     ],
256     'Finger' => [
257         "Finger protocol (RFC 742)",
258         { action => 'PARAM', proto => 'tcp', dport => '79' },
259     ],
260     'GNUnet' => [
261         "GNUnet secure peer-to-peer networking traffic",
262         { action => 'PARAM', proto => 'tcp', dport => '2086' },
263         { action => 'PARAM', proto => 'udp', dport => '2086' },
264         { action => 'PARAM', proto => 'tcp', dport => '1080' },
265         { action => 'PARAM', proto => 'udp', dport => '1080' },
266     ],
267     'GRE' => [
268         "Generic Routing Encapsulation tunneling protocol",
269         { action => 'PARAM', proto => '47' },
270     ],
271     'Git' => [
272         "Git distributed revision control traffic",
273         { action => 'PARAM', proto => 'tcp', dport => '9418' },
274     ],
275     'HKP' => [
276         "OpenPGP HTTP keyserver protocol traffic",
277         { action => 'PARAM', proto => 'tcp', dport => '11371' },
278     ],
279     'HTTP' => [
280         "Hypertext Transfer Protocol (WWW)",
281         { action => 'PARAM', proto => 'tcp', dport => '80' },
282     ],
283     'HTTPS' => [
284         "Hypertext Transfer Protocol (WWW) over SSL",
285         { action => 'PARAM', proto => 'tcp', dport => '443' },
286     ],
287     'ICPV2' => [
288         "Internet Cache Protocol V2 (Squid) traffic",
289         { action => 'PARAM', proto => 'udp', dport => '3130' },
290     ],
291     'ICQ' => [
292         "AOL Instant Messenger traffic",
293         { action => 'PARAM', proto => 'tcp', dport => '5190' },
294     ],
295     'IMAP' => [
296         "Internet Message Access Protocol",
297         { action => 'PARAM', proto => 'tcp', dport => '143' },
298     ],
299     'IMAPS' => [
300         "Internet Message Access Protocol over SSL",
301         { action => 'PARAM', proto => 'tcp', dport => '993' },
302     ],
303     'IPIP' => [
304         "IPIP capsulation traffic",
305         { action => 'PARAM', proto => '94' },
306     ],
307     'IPsec' => [
308         "IPsec traffic",
309         { action => 'PARAM', proto => 'udp', dport => '500', sport => '500' },
310         { action => 'PARAM', proto => '50' },
311     ],
312     'IPsecah' => [
313         "IPsec authentication (AH) traffic",
314         { action => 'PARAM', proto => 'udp', dport => '500', sport => '500' },
315         { action => 'PARAM', proto => '51' },
316     ],
317     'IPsecnat' => [
318         "IPsec traffic and Nat-Traversal",
319         { action => 'PARAM', proto => 'udp', dport => '500' },
320         { action => 'PARAM', proto => 'udp', dport => '4500' },
321         { action => 'PARAM', proto => '50' },
322     ],
323     'IRC' => [
324         "Internet Relay Chat traffic",
325         { action => 'PARAM', proto => 'tcp', dport => '6667' },
326     ],
327     'Jetdirect' => [
328         "HP Jetdirect printing",
329         { action => 'PARAM', proto => 'tcp', dport => '9100' },
330     ],
331     'L2TP' => [
332         "Layer 2 Tunneling Protocol traffic",
333         { action => 'PARAM', proto => 'udp', dport => '1701' },
334     ],
335     'LDAP' => [
336         "Lightweight Directory Access Protocol traffic",
337         { action => 'PARAM', proto => 'tcp', dport => '389' },
338     ],
339     'LDAPS' => [
340         "Secure Lightweight Directory Access Protocol traffic",
341         { action => 'PARAM', proto => 'tcp', dport => '636' },
342     ],
343     'MSNP' => [
344         "Microsoft Notification Protocol",
345         { action => 'PARAM', proto => 'tcp', dport => '1863' },
346     ],
347     'MSSQL' => [
348         "Microsoft SQL Server",
349         { action => 'PARAM', proto => 'tcp', dport => '1433' },
350     ],
351     'Mail' => [
352         "Mail traffic (SMTP, SMTPS, Submission)",
353         { action => 'PARAM', proto => 'tcp', dport => '25' },
354         { action => 'PARAM', proto => 'tcp', dport => '465' },
355         { action => 'PARAM', proto => 'tcp', dport => '587' },
356     ],
357     'MDNS' => [
358         "Multicast DNS",
359         { action => 'PARAM', proto => 'udp', dport => '5353' },
360     ],
361     'Munin' => [
362         "Munin networked resource monitoring traffic",
363         { action => 'PARAM', proto => 'tcp', dport => '4949' },
364     ],
365     'MySQL' => [
366         "MySQL server",
367         { action => 'PARAM', proto => 'tcp', dport => '3306' },
368     ],
369     'NNTP' => [
370         "NNTP traffic (Usenet).",
371         { action => 'PARAM', proto => 'tcp', dport => '119' },
372     ],
373     'NNTPS' => [
374         "Encrypted NNTP traffic (Usenet)",
375         { action => 'PARAM', proto => 'tcp', dport => '563' },
376     ],
377     'NTP' => [
378         "Network Time Protocol (ntpd)",
379         { action => 'PARAM', proto => 'udp', dport => '123' },
380     ],
381     'OSPF' => [
382         "OSPF multicast traffic",
383         { action => 'PARAM', proto => '89' },
384     ],
385     'OpenVPN' => [
386         "OpenVPN traffic",
387         { action => 'PARAM', proto => 'udp', dport => '1194' },
388     ],
389     'PCA' => [
390         "Symantec PCAnywere (tm)",
391         { action => 'PARAM', proto => 'udp', dport => '5632' },
392         { action => 'PARAM', proto => 'tcp', dport => '5631' },
393     ],
394     'POP3' => [
395         "POP3 traffic",
396         { action => 'PARAM', proto => 'tcp', dport => '110' },
397     ],
398     'POP3S' => [
399         "Encrypted POP3 traffic",
400         { action => 'PARAM', proto => 'tcp', dport => '995' },
401     ],
402     'PPtP' => [
403         "Point-to-Point Tunneling Protocol",
404         { action => 'PARAM', proto => '47' },
405         { action => 'PARAM', proto => 'tcp', dport => '1723' },
406     ],
407     'Ping' => [
408         "ICMP echo request",
409         { action => 'PARAM', proto => 'icmp', dport => 'echo-request' },
410     ],
411     'PostgreSQL' => [
412         "PostgreSQL server",
413         { action => 'PARAM', proto => 'tcp', dport => '5432' },
414     ],
415     'Printer' => [
416         "Line Printer protocol printing",
417         { action => 'PARAM', proto => 'tcp', dport => '515' },
418     ],
419     'RDP' => [
420         "Microsoft Remote Desktop Protocol traffic",
421         { action => 'PARAM', proto => 'tcp', dport => '3389' },
422     ],
423     'RIP' => [
424         "Routing Information Protocol (bidirectional)",
425         { action => 'PARAM', proto => 'udp', dport => '520' },
426     ],
427     'RNDC' => [
428         "BIND remote management protocol",
429         { action => 'PARAM', proto => 'tcp', dport => '953' },
430     ],
431     'Razor' => [
432         "Razor Antispam System",
433         { action => 'PARAM', proto => 'tcp', dport => '2703' },
434     ],
435     'Rdate' => [
436         "Remote time retrieval (rdate)",
437         { action => 'PARAM', proto => 'tcp', dport => '37' },
438     ],
439     'Rsync' => [
440         "Rsync server",
441         { action => 'PARAM', proto => 'tcp', dport => '873' },
442     ],
443     'SANE' => [
444         "SANE network scanning",
445         { action => 'PARAM', proto => 'tcp', dport => '6566' },
446     ],
447     'SMB' => [
448         "Microsoft SMB traffic",
449         { action => 'PARAM', proto => 'udp', dport => '135,445' },
450         { action => 'PARAM', proto => 'udp', dport => '137:139' },
451         { action => 'PARAM', proto => 'udp', dport => '1024:65535', sport => '137' },
452         { action => 'PARAM', proto => 'tcp', dport => '135,139,445' },
453     ],
454     'SMBswat' => [
455         "Samba Web Administration Tool",
456         { action => 'PARAM', proto => 'tcp', dport => '901' },
457     ],
458     'SMTP' => [
459         "Simple Mail Transfer Protocol",
460         { action => 'PARAM', proto => 'tcp', dport => '25' },
461     ],
462     'SMTPS' => [
463         "Encrypted Simple Mail Transfer Protocol",
464         { action => 'PARAM', proto => 'tcp', dport => '465' },
465     ],
466     'SNMP' => [
467         "Simple Network Management Protocol",
468         { action => 'PARAM', proto => 'udp', dport => '161:162' },
469         { action => 'PARAM', proto => 'tcp', dport => '161' },
470     ],
471     'SPAMD' => [
472         "Spam Assassin SPAMD traffic",
473         { action => 'PARAM', proto => 'tcp', dport => '783' },
474     ],
475     'SSH' => [
476         "Secure shell traffic",
477         { action => 'PARAM', proto => 'tcp', dport => '22' },
478     ],
479     'SVN' => [
480         "Subversion server (svnserve)",
481         { action => 'PARAM', proto => 'tcp', dport => '3690' },
482     ],
483     'SixXS' => [
484         "SixXS IPv6 Deployment and Tunnel Broker",
485         { action => 'PARAM', proto => 'tcp', dport => '3874' },
486         { action => 'PARAM', proto => 'udp', dport => '3740' },
487         { action => 'PARAM', proto => '41' },
488         { action => 'PARAM', proto => 'udp', dport => '5072,8374' },
489     ],
490     'Squid' => [
491         "Squid web proxy traffic",
492         { action => 'PARAM', proto => 'tcp', dport => '3128' },
493     ],
494     'Submission' => [
495         "Mail message submission traffic",
496         { action => 'PARAM', proto => 'tcp', dport => '587' },
497     ],
498     'Syslog' => [
499         "Syslog protocol (RFC 5424) traffic",
500         { action => 'PARAM', proto => 'udp', dport => '514' },
501         { action => 'PARAM', proto => 'tcp', dport => '514' },
502     ],
503     'TFTP' => [
504         "Trivial File Transfer Protocol traffic",
505         { action => 'PARAM', proto => 'udp', dport => '69' },
506     ],
507     'Telnet' => [
508         "Telnet traffic",
509         { action => 'PARAM', proto => 'tcp', dport => '23' },
510     ],
511     'Telnets' => [
512         "Telnet over SSL",
513         { action => 'PARAM', proto => 'tcp', dport => '992' },
514     ],
515     'Time' => [
516         "RFC 868 Time protocol",
517         { action => 'PARAM', proto => 'tcp', dport => '37' },
518     ],
519     'Trcrt' => [
520         "Traceroute (for up to 30 hops) traffic",
521         { action => 'PARAM', proto => 'udp', dport => '33434:33524' },
522         { action => 'PARAM', proto => 'icmp', dport => 'echo-request' },
523     ],
524     'VNC' => [
525         "VNC traffic for VNC display's 0 - 99",
526         { action => 'PARAM', proto => 'tcp', dport => '5900:5999' },
527     ],
528     'VNCL' => [
529         "VNC traffic from Vncservers to Vncviewers in listen mode",
530         { action => 'PARAM', proto => 'tcp', dport => '5500' },
531     ],
532     'Web' => [
533         "WWW traffic (HTTP and HTTPS)",
534         { action => 'PARAM', proto => 'tcp', dport => '80' },
535         { action => 'PARAM', proto => 'tcp', dport => '443' },
536     ],
537     'Webcache' => [
538         "Web Cache/Proxy traffic (port 8080)",
539         { action => 'PARAM', proto => 'tcp', dport => '8080' },
540     ],
541     'Webmin' => [
542         "Webmin traffic",
543         { action => 'PARAM', proto => 'tcp', dport => '10000' },
544     ],
545     'Whois' => [
546         "Whois (nicname, RFC 3912) traffic",
547         { action => 'PARAM', proto => 'tcp', dport => '43' },
548     ],
549 };
550
551 my $pve_fw_parsed_macros;
552 my $pve_fw_macro_descr;
553 my $pve_fw_macro_ipversion = {};
554 my $pve_fw_preferred_macro_names = {};
555
556 my $FWACCEPTMARK_ON  = "0x80000000/0x80000000";
557 my $FWACCEPTMARK_OFF = "0x00000000/0x80000000";
558
559 my $pve_std_chains = {};
560 my $pve_std_chains_conf = {};
561 $pve_std_chains_conf->{4} = {
562     'PVEFW-SET-ACCEPT-MARK' => [
563         { target => "-j MARK --set-mark $FWACCEPTMARK_ON" },
564     ],
565     'PVEFW-DropBroadcast' => [
566         # same as shorewall 'Broadcast'
567         # simply DROP BROADCAST/MULTICAST/ANYCAST
568         # we can use this to reduce logging
569         { action => 'DROP', dsttype => 'BROADCAST' },
570         { action => 'DROP', dsttype => 'MULTICAST' },
571         { action => 'DROP', dsttype => 'ANYCAST' },
572         { action => 'DROP', dest => '224.0.0.0/4' },
573     ],
574     'PVEFW-reject' => [
575         # same as shorewall 'reject'
576         { action => 'DROP', dsttype => 'BROADCAST' },
577         { action => 'DROP', source => '224.0.0.0/4' },
578         { action => 'DROP', proto => 'icmp' },
579         { match => '-p tcp', target => '-j REJECT --reject-with tcp-reset' },
580         { match => '-p udp', target => '-j REJECT --reject-with icmp-port-unreachable' },
581         { match => '-p icmp', target => '-j REJECT --reject-with icmp-host-unreachable' },
582         { target => '-j REJECT --reject-with icmp-host-prohibited' },
583     ],
584     'PVEFW-Drop' => [
585         # same as shorewall 'Drop', which is equal to DROP,
586         # but REJECT/DROP some packages to reduce logging,
587         # and ACCEPT critical ICMP types
588         { action => 'PVEFW-reject',  proto => 'tcp', dport => '43' }, # REJECT 'auth'
589         # we are not interested in BROADCAST/MULTICAST/ANYCAST
590         { action => 'PVEFW-DropBroadcast' },
591         # ACCEPT critical ICMP types
592         { action => 'ACCEPT', proto => 'icmp', dport => 'fragmentation-needed' },
593         { action => 'ACCEPT', proto => 'icmp', dport => 'time-exceeded' },
594         # Drop packets with INVALID state
595         { action => 'DROP', match => '-m conntrack --ctstate INVALID', },
596         # Drop Microsoft SMB noise
597         { action => 'DROP', proto => 'udp', dport => '135,445' },
598         { action => 'DROP', proto => 'udp', dport => '137:139' },
599         { action => 'DROP', proto => 'udp', dport => '1024:65535', sport => 137 },
600         { action => 'DROP', proto => 'tcp', dport => '135,139,445' },
601         { action => 'DROP', proto => 'udp', dport => 1900 }, # UPnP
602         # Drop new/NotSyn traffic so that it doesn't get logged
603         { action => 'DROP', match => '-p tcp -m tcp ! --tcp-flags FIN,SYN,RST,ACK SYN' },
604         # Drop DNS replies
605         { action => 'DROP', proto => 'udp', sport => 53 },
606     ],
607     'PVEFW-Reject' => [
608         # same as shorewall 'Reject', which is equal to Reject,
609         # but REJECT/DROP some packages to reduce logging,
610         # and ACCEPT critical ICMP types
611         { action => 'PVEFW-reject',  proto => 'tcp', dport => '43' }, # REJECT 'auth'
612         # we are not interested in BROADCAST/MULTICAST/ANYCAST
613         { action => 'PVEFW-DropBroadcast' },
614         # ACCEPT critical ICMP types
615         { action => 'ACCEPT', proto => 'icmp', dport => 'fragmentation-needed' },
616         { action => 'ACCEPT', proto => 'icmp', dport => 'time-exceeded' },
617         # Drop packets with INVALID state
618         { action => 'DROP', match => '-m conntrack --ctstate INVALID', },
619         # Drop Microsoft SMB noise
620         { action => 'PVEFW-reject', proto => 'udp', dport => '135,445' },
621         { action => 'PVEFW-reject', proto => 'udp', dport => '137:139'},
622         { action => 'PVEFW-reject', proto => 'udp', dport => '1024:65535', sport => 137 },
623         { action => 'PVEFW-reject', proto => 'tcp', dport => '135,139,445' },
624         { action => 'DROP', proto => 'udp', dport => 1900 }, # UPnP
625         # Drop new/NotSyn traffic so that it doesn't get logged
626         { action => 'DROP', match => '-p tcp -m tcp ! --tcp-flags FIN,SYN,RST,ACK SYN' },
627         # Drop DNS replies
628         { action => 'DROP', proto => 'udp', sport => 53 },
629     ],
630     'PVEFW-tcpflags' => [
631         # same as shorewall tcpflags action.
632         # Packets arriving on this interface are checked for som illegal combinations of TCP flags
633         { match => '-p tcp -m tcp --tcp-flags FIN,SYN,RST,PSH,ACK,URG FIN,PSH,URG', target => '-g PVEFW-logflags' },
634         { match => '-p tcp -m tcp --tcp-flags FIN,SYN,RST,PSH,ACK,URG NONE', target => '-g PVEFW-logflags' },
635         { match => '-p tcp -m tcp --tcp-flags SYN,RST SYN,RST', target => '-g PVEFW-logflags' },
636         { match => '-p tcp -m tcp --tcp-flags FIN,SYN FIN,SYN', target => '-g PVEFW-logflags' },
637         { match => '-p tcp -m tcp --sport 0 --tcp-flags FIN,SYN,RST,ACK SYN', target => '-g PVEFW-logflags' },
638     ],
639     'PVEFW-smurfs' => [
640         # same as shorewall smurfs action
641         # Filter packets for smurfs (packets with a broadcast address as the source).
642         { match => '-s 0.0.0.0/32', target => '-j RETURN' }, # allow DHCP
643         { match => '-m addrtype --src-type BROADCAST', target => '-g PVEFW-smurflog' },
644         { match => '-s 224.0.0.0/4', target => '-g PVEFW-smurflog' },
645     ],
646     'PVEFW-smurflog' => [
647         { action => 'DROP', logmsg => 'DROP: ' },
648     ],
649     'PVEFW-logflags' => [
650         { action => 'DROP', logmsg => 'DROP: ' },
651     ],
652 };
653
654 $pve_std_chains_conf->{6} = {
655     'PVEFW-SET-ACCEPT-MARK' => [
656         { target => "-j MARK --set-mark $FWACCEPTMARK_ON" },
657     ],
658     'PVEFW-DropBroadcast' => [
659         # same as shorewall 'Broadcast'
660         # simply DROP BROADCAST/MULTICAST/ANYCAST
661         # we can use this to reduce logging
662         #{ action => 'DROP', dsttype => 'BROADCAST' }, #no broadcast in ipv6
663         # ipv6 addrtype does not work with kernel 2.6.32
664         #{ action => 'DROP', dsttype => 'MULTICAST' },
665         #{ action => 'DROP', dsttype => 'ANYCAST' },
666         { action => 'DROP', dest => 'ff00::/8' },
667         #{ action => 'DROP', dest => '224.0.0.0/4' },
668     ],
669     'PVEFW-reject' => [
670         { action => 'DROP', proto => 'icmpv6' },
671         { match => '-p tcp', target => '-j REJECT --reject-with tcp-reset' },
672         { match => '-p udp', target => '-j REJECT --reject-with icmp6-port-unreachable' },
673         { target => '-j REJECT --reject-with icmp6-adm-prohibited' },
674     ],
675     'PVEFW-Drop' => [
676         # same as shorewall 'Drop', which is equal to DROP,
677         # but REJECT/DROP some packages to reduce logging,
678         # and ACCEPT critical ICMP types
679         { action => 'PVEFW-reject', proto => 'tcp', dport => '43' }, # REJECT 'auth'
680         # we are not interested in BROADCAST/MULTICAST/ANYCAST
681         { action => 'PVEFW-DropBroadcast' },
682         # ACCEPT critical ICMP types
683         { action => 'ACCEPT', proto => 'icmpv6', dport => 'destination-unreachable' },
684         { action => 'ACCEPT', proto => 'icmpv6', dport => 'time-exceeded' },
685         { action => 'ACCEPT', proto => 'icmpv6', dport => 'packet-too-big' },
686         # Drop packets with INVALID state
687         { action => 'DROP', match => '-m conntrack --ctstate INVALID', },
688         # Drop Microsoft SMB noise
689         { action => 'DROP', proto => 'udp', dport => '135,445' },
690         { action => 'DROP', proto => 'udp', dport => '137:139'},
691         { action => 'DROP', proto => 'udp', dport => '1024:65535', sport => 137 },
692         { action => 'DROP', proto => 'tcp', dport => '135,139,445' },
693         { action => 'DROP', proto => 'udp', dport => 1900 }, # UPnP
694         # Drop new/NotSyn traffic so that it doesn't get logged
695         { action => 'DROP', match => '-p tcp -m tcp ! --tcp-flags FIN,SYN,RST,ACK SYN' },
696         # Drop DNS replies
697         { action => 'DROP', proto => 'udp', sport => 53 },
698     ],
699     'PVEFW-Reject' => [
700         # same as shorewall 'Reject', which is equal to Reject,
701         # but REJECT/DROP some packages to reduce logging,
702         # and ACCEPT critical ICMP types
703         { action => 'PVEFW-reject',  proto => 'tcp', dport => '43' }, # REJECT 'auth'
704         # we are not interested in BROADCAST/MULTICAST/ANYCAST
705         { action => 'PVEFW-DropBroadcast' },
706         # ACCEPT critical ICMP types
707         { action => 'ACCEPT', proto => 'icmpv6', dport => 'destination-unreachable' },
708         { action => 'ACCEPT', proto => 'icmpv6', dport => 'time-exceeded' },
709         { action => 'ACCEPT', proto => 'icmpv6', dport => 'packet-too-big' },
710         # Drop packets with INVALID state
711         { action => 'DROP', match => '-m conntrack --ctstate INVALID', },
712         # Drop Microsoft SMB noise
713         { action => 'PVEFW-reject', proto => 'udp', dport => '135,445' },
714         { action => 'PVEFW-reject', proto => 'udp', dport => '137:139' },
715         { action => 'PVEFW-reject', proto => 'udp', dport => '1024:65535', sport => 137 },
716         { action => 'PVEFW-reject', proto => 'tcp', dport => '135,139,445' },
717         { action => 'DROP', proto => 'udp', dport => 1900 }, # UPnP
718         # Drop new/NotSyn traffic so that it doesn't get logged
719         { action => 'DROP', match => '-p tcp -m tcp ! --tcp-flags FIN,SYN,RST,ACK SYN' },
720         # Drop DNS replies
721         { action => 'DROP', proto => 'udp', sport => 53 },
722     ],
723     'PVEFW-tcpflags' => [
724         # same as shorewall tcpflags action.
725         # Packets arriving on this interface are checked for som illegal combinations of TCP flags
726         { match => '-p tcp -m tcp --tcp-flags FIN,SYN,RST,PSH,ACK,URG FIN,PSH,URG', target => '-g PVEFW-logflags' },
727         { match => '-p tcp -m tcp --tcp-flags FIN,SYN,RST,PSH,ACK,URG NONE', target => '-g PVEFW-logflags' },
728         { match => '-p tcp -m tcp --tcp-flags SYN,RST SYN,RST', target => '-g PVEFW-logflags' },
729         { match => '-p tcp -m tcp --tcp-flags FIN,SYN FIN,SYN', target => '-g PVEFW-logflags' },
730         { match => '-p tcp -m tcp --sport 0 --tcp-flags FIN,SYN,RST,ACK SYN', target => '-g PVEFW-logflags' },
731     ],
732     'PVEFW-logflags' => [
733         { action => 'DROP', logmsg => 'DROP: ' },
734     ],
735 };
736
737 # iptables -p icmp -h
738 my $icmp_type_names = {
739     any => 1,
740     'echo-reply' => 1,
741     'destination-unreachable' => 1,
742     'network-unreachable' => 1,
743     'host-unreachable' => 1,
744     'protocol-unreachable' => 1,
745     'port-unreachable' => 1,
746     'fragmentation-needed' => 1,
747     'source-route-failed' => 1,
748     'network-unknown' => 1,
749     'host-unknown' => 1,
750     'network-prohibited' => 1,
751     'host-prohibited' => 1,
752     'TOS-network-unreachable' => 1,
753     'TOS-host-unreachable' => 1,
754     'communication-prohibited' => 1,
755     'host-precedence-violation' => 1,
756     'precedence-cutoff' => 1,
757     'source-quench' => 1,
758     'redirect' => 1,
759     'network-redirect' => 1,
760     'host-redirect' => 1,
761     'TOS-network-redirect' => 1,
762     'TOS-host-redirect' => 1,
763     'echo-request' => 1,
764     'router-advertisement' => 1,
765     'router-solicitation' => 1,
766     'time-exceeded' => 1,
767     'ttl-zero-during-transit' => 1,
768     'ttl-zero-during-reassembly' => 1,
769     'parameter-problem' => 1,
770     'ip-header-bad' => 1,
771     'required-option-missing' => 1,
772     'timestamp-request' => 1,
773     'timestamp-reply' => 1,
774     'address-mask-request' => 1,
775     'address-mask-reply' => 1,
776 };
777
778 # ip6tables -p icmpv6 -h
779
780 my $icmpv6_type_names = {
781     'any' => 1,
782     'destination-unreachable' => 1,
783     'no-route' => 1,
784     'communication-prohibited' => 1,
785     'address-unreachable' => 1,
786     'port-unreachable' => 1,
787     'packet-too-big' => 1,
788     'time-exceeded' => 1,
789     'ttl-zero-during-transit' => 1,
790     'ttl-zero-during-reassembly' => 1,
791     'parameter-problem' => 1,
792     'bad-header' => 1,
793     'unknown-header-type' => 1,
794     'unknown-option' => 1,
795     'echo-request' => 1,
796     'echo-reply' => 1,
797     'router-solicitation' => 1,
798     'router-advertisement' => 1,
799     'neighbor-solicitation' => 1,
800     'neighbour-solicitation' => 1,
801     'neighbor-advertisement' => 1,
802     'neighbour-advertisement' => 1,
803     'redirect' => 1,
804 };
805
806 sub init_firewall_macros {
807
808     $pve_fw_parsed_macros = {};
809
810     my $parse = sub {
811         my ($k, $macro) = @_;
812         my $lc_name = lc($k);
813         $pve_fw_macro_ipversion->{$k} = 0;
814         while (!ref($macro->[0])) {
815             my $desc = shift @$macro;
816             if ($desc eq 'ipv4only') {
817                 $pve_fw_macro_ipversion->{$k} = 4;
818             } elsif ($desc eq 'ipv6only') {
819                 $pve_fw_macro_ipversion->{$k} = 6;
820             } else {
821                 $pve_fw_macro_descr->{$k} = $desc;
822             }
823         }
824         $pve_fw_preferred_macro_names->{$lc_name} = $k;
825         $pve_fw_parsed_macros->{$k} = $macro;
826     };
827
828     foreach my $k (keys %$pve_fw_macros) {
829         &$parse($k, $pve_fw_macros->{$k});
830     }
831
832     foreach my $k (keys %$pve_ipv6fw_macros) {
833         next if $pve_fw_parsed_macros->{$k};
834         &$parse($k, $pve_ipv6fw_macros->{$k});
835         $pve_fw_macro_ipversion->{$k} = 6;
836     }
837 }
838
839 init_firewall_macros();
840
841 sub get_macros {
842     return wantarray ? ($pve_fw_parsed_macros, $pve_fw_macro_descr): $pve_fw_parsed_macros;
843 }
844
845 my $etc_services;
846
847 sub get_etc_services {
848
849     return $etc_services if $etc_services;
850
851     my $filename = "/etc/services";
852
853     my $fh = IO::File->new($filename, O_RDONLY);
854     if (!$fh) {
855         warn "unable to read '$filename' - $!\n";
856         return {};
857     }
858
859     my $services = {};
860
861     while (my $line = <$fh>) {
862         chomp ($line);
863         next if $line =~m/^#/;
864         next if ($line =~m/^\s*$/);
865
866         if ($line =~ m!^(\S+)\s+(\S+)/(tcp|udp|sctp).*$!) {
867             $services->{byid}->{$2}->{name} = $1;
868             $services->{byid}->{$2}->{port} = $2;
869             $services->{byid}->{$2}->{$3} = 1;
870             $services->{byname}->{$1} = $services->{byid}->{$2};
871         }
872     }
873
874     close($fh);
875
876     $etc_services = $services;
877
878
879     return $etc_services;
880 }
881
882 sub parse_protocol_file {
883     my ($filename) = @_;
884
885     my $fh = IO::File->new($filename, O_RDONLY);
886     if (!$fh) {
887         warn "unable to read '$filename' - $!\n";
888         return {};
889     }
890
891     my $protocols = {};
892
893     while (my $line = <$fh>) {
894         chomp ($line);
895         next if $line =~m/^#/;
896         next if ($line =~m/^\s*$/);
897
898         if ($line =~ m!^(\S+)\s+(\d+)(?:\s+.*)?$!) {
899             $protocols->{byid}->{$2}->{name} = $1;
900             $protocols->{byname}->{$1} = $protocols->{byid}->{$2};
901         }
902     }
903
904     close($fh);
905
906     return $protocols;
907 }
908
909 my $etc_protocols;
910
911 sub get_etc_protocols {
912     return $etc_protocols if $etc_protocols;
913
914     my $protocols = parse_protocol_file('/etc/protocols');
915
916     # add special case for ICMP v6
917     $protocols->{byid}->{icmpv6}->{name} = "icmpv6";
918     $protocols->{byname}->{icmpv6} = $protocols->{byid}->{icmpv6};
919
920     $etc_protocols = $protocols;
921
922     return $etc_protocols;
923 }
924
925 my $etc_ethertypes;
926
927 sub get_etc_ethertypes {
928     $etc_ethertypes = parse_protocol_file('/etc/ethertypes')
929         if !$etc_ethertypes;
930     return $etc_ethertypes;
931 }
932
933 my $__local_network;
934
935 sub local_network {
936     my ($new_value) = @_;
937
938     $__local_network = $new_value if defined($new_value);
939
940     return $__local_network if defined($__local_network);
941
942     eval {
943         my $nodename = PVE::INotify::nodename();
944
945         my $ip = PVE::Cluster::remote_node_ip($nodename);
946
947         my $testip = Net::IP->new($ip);
948
949         my $isv6 = $testip->version == 6;
950         my $routes = $isv6 ? PVE::ProcFSTools::read_proc_net_ipv6_route()
951                            : PVE::ProcFSTools::read_proc_net_route();
952         foreach my $entry (@$routes) {
953             my $mask;
954             if ($isv6) {
955                 $mask = $entry->{prefix};
956                 next if !$mask; # skip the default route...
957             } else {
958                 $mask = $PVE::Network::ipv4_mask_hash_localnet->{$entry->{mask}};
959                 next if !defined($mask);
960             }
961             my $cidr = "$entry->{dest}/$mask";
962             my $testnet = Net::IP->new($cidr);
963             my $overlap = $testnet->overlaps($testip);
964             if ($overlap == $Net::IP::IP_B_IN_A_OVERLAP ||
965                 $overlap == $Net::IP::IP_IDENTICAL)
966             {
967                 $__local_network = $cidr;
968                 return;
969             }
970         }
971     };
972     warn $@ if $@;
973
974     return $__local_network;
975 }
976
977 # ipset names are limited to 31 characters,
978 # and we use '-v4' or '-v6' to indicate IP versions, 
979 # and we use '_swap' suffix for atomic update, 
980 # for example PVEFW-${VMID}-${ipset_name}_swap
981
982 my $max_iptables_ipset_name_length = 31 - length("PVEFW-") - length("_swap");
983
984 sub compute_ipset_chain_name {
985     my ($vmid, $ipset_name, $ipversion) = @_;
986
987     $vmid = 0 if !defined($vmid);
988
989     my $id = "$vmid-${ipset_name}-v$ipversion";
990
991     if (length($id) > $max_iptables_ipset_name_length) {
992         $id = PVE::Tools::fnv31a_hex($id);
993     }
994
995     return "PVEFW-$id";
996 }
997
998 sub compute_ipfilter_ipset_name {
999     my ($iface) = @_;
1000
1001     return "ipfilter-$iface";
1002 }
1003
1004 sub parse_address_list {
1005     my ($str) = @_;
1006
1007     if ($str =~ m/^(\+)(\S+)$/) { # ipset ref
1008         die "ipset name too long\n" if length($str) > ($max_ipset_name_length + 1);
1009         return;
1010     }
1011
1012     if ($str =~ m/^${ip_alias_pattern}$/) {
1013         die "alias name too long\n" if length($str) > $max_alias_name_length;
1014         return;
1015     }
1016
1017     my $count = 0;
1018     my $iprange = 0;
1019     my $ipversion;
1020
1021     my @elements = split(/,/, $str);
1022     die "extraneous commas in list\n" if $str ne join(',', @elements);
1023     foreach my $elem (@elements) {
1024         $count++;
1025         my $ip = Net::IP->new($elem);
1026         if (!$ip) {
1027             my $err = Net::IP::Error();
1028             die "invalid IP address: $err\n";
1029         }
1030         $iprange = 1 if $elem =~ m/-/;
1031
1032         my $new_ipversion = Net::IP::ip_is_ipv6($ip->ip()) ? 6 : 4;
1033
1034         die "detected mixed ipv4/ipv6 addresses in address list '$str'\n"
1035             if $ipversion && ($new_ipversion != $ipversion);
1036
1037         $ipversion = $new_ipversion;
1038     }
1039
1040     die "you can't use a range in a list\n" if $iprange && $count > 1;
1041
1042     return $ipversion;
1043 }
1044
1045 sub parse_port_name_number_or_range {
1046     my ($str, $dport) = @_;
1047
1048     my $services = PVE::Firewall::get_etc_services();
1049     my $count = 0;
1050     my $icmp_port = 0;
1051
1052     my @elements = split(/,/, $str);
1053     die "extraneous commas in list\n" if $str ne join(',', @elements);
1054     foreach my $item (@elements) {
1055         if ($item =~ m/^([0-9]+):([0-9]+)$/) {
1056             $count += 2;
1057             my ($port1, $port2) = ($1, $2);
1058             die "invalid port '$port1'\n" if $port1 > 65535;
1059             die "invalid port '$port2'\n" if $port2 > 65535;
1060             die "backwards range '$port1:$port2' not allowed, did you mean '$port2:$port1'?\n" if $port1 > $port2;
1061         } elsif ($item =~ m/^([0-9]+)$/) {
1062             $count += 1;
1063             my $port = $1;
1064             die "invalid port '$port'\n" if $port > 65535;
1065         } else {
1066             if ($dport && $icmp_type_names->{$item}) {
1067                 $icmp_port = 1;
1068             } elsif ($dport && $icmpv6_type_names->{$item}) {
1069                 $icmp_port = 1;
1070             } else {
1071                 die "invalid port '$item'\n" if !$services->{byname}->{$item};
1072             }
1073         }
1074     }
1075
1076     die "ICPM ports not allowed in port range\n" if $icmp_port && $count > 0;
1077
1078     # I really don't like to use the word number here, but it's the only thing
1079     # that makes sense in a literal way. The range 1:100 counts as 2, not as
1080     # one and not as 100...
1081     die "too many entries in port list (> 15 numbers)\n"
1082         if $count > 15;
1083
1084     return (scalar(@elements) > 1);
1085 }
1086
1087 PVE::JSONSchema::register_format('pve-fw-sport-spec', \&pve_fw_verify_sport_spec);
1088 sub pve_fw_verify_sport_spec {
1089    my ($portstr) = @_;
1090
1091    parse_port_name_number_or_range($portstr, 0);
1092
1093    return $portstr;
1094 }
1095
1096 PVE::JSONSchema::register_format('pve-fw-dport-spec', \&pve_fw_verify_dport_spec);
1097 sub pve_fw_verify_dport_spec {
1098    my ($portstr) = @_;
1099
1100    parse_port_name_number_or_range($portstr, 1);
1101
1102    return $portstr;
1103 }
1104
1105 PVE::JSONSchema::register_format('pve-fw-addr-spec', \&pve_fw_verify_addr_spec);
1106 sub pve_fw_verify_addr_spec {
1107    my ($list) = @_;
1108
1109    parse_address_list($list);
1110
1111    return $list;
1112 }
1113
1114 PVE::JSONSchema::register_format('pve-fw-protocol-spec', \&pve_fw_verify_protocol_spec);
1115 sub pve_fw_verify_protocol_spec {
1116    my ($proto) = @_;
1117
1118    my $protocols = get_etc_protocols();
1119
1120    die "unknown protocol '$proto'\n" if $proto &&
1121        !(defined($protocols->{byname}->{$proto}) ||
1122          defined($protocols->{byid}->{$proto}));
1123
1124    return $proto;
1125 }
1126
1127
1128 # helper function for API
1129
1130 sub copy_opject_with_digest {
1131     my ($object) = @_;
1132
1133     my $sha = Digest::SHA->new('sha1');
1134
1135     my $res = {};
1136     foreach my $k (sort keys %$object) {
1137         my $v = $object->{$k};
1138         next if !defined($v);
1139         $res->{$k} = $v;
1140         $sha->add($k, ':', $v, "\n");
1141     }
1142
1143     my $digest = $sha->hexdigest;
1144
1145     $res->{digest} = $digest;
1146
1147     return wantarray ? ($res, $digest) : $res;
1148 }
1149
1150 sub copy_list_with_digest {
1151     my ($list) = @_;
1152
1153     my $sha = Digest::SHA->new('sha1');
1154
1155     my $res = [];
1156     foreach my $entry (@$list) {
1157         my $data = {};
1158         foreach my $k (sort keys %$entry) {
1159             my $v = $entry->{$k};
1160             next if !defined($v);
1161             $data->{$k} = $v;
1162             # Note: digest ignores refs ($rule->{errors})
1163             # since Digest::SHA expects a series of bytes,
1164             #  we have to encode the value here to prevent errors when
1165             #  using utf8 characters (eg. in comments)
1166             $sha->add($k, ':', encode_utf8($v), "\n") if !ref($v); ;
1167         }
1168         push @$res, $data;
1169     }
1170
1171     my $digest = $sha->hexdigest;
1172
1173     foreach my $entry (@$res) {
1174         $entry->{digest} = $digest;
1175     }
1176
1177     return wantarray ? ($res, $digest) : $res;
1178 }
1179
1180 our $cluster_option_properties = {
1181     enable => {
1182         description => "Enable or disable the firewall cluster wide.",
1183         type => 'integer',
1184         minimum => 0,
1185         optional => 1,
1186     },
1187     ebtables => {
1188         description => "Enable ebtables rules cluster wide.",
1189         type => 'boolean',
1190         default => 1,
1191         optional => 1,
1192     },
1193     policy_in => {
1194         description => "Input policy.",
1195         type => 'string',
1196         optional => 1,
1197         enum => ['ACCEPT', 'REJECT', 'DROP'],
1198     },
1199     policy_out => {
1200         description => "Output policy.",
1201         type => 'string',
1202         optional => 1,
1203         enum => ['ACCEPT', 'REJECT', 'DROP'],
1204     },
1205     log_ratelimit => {
1206         description => "Log ratelimiting settings",
1207         type => 'string', format => {
1208             enable => {
1209                 default_key => 1,
1210                 description => 'Enable or disable log rate limiting',
1211                 type => 'boolean',
1212                 default => '1',
1213             },
1214             rate => {
1215                 type => 'string',
1216                 description => 'Frequency with which the burst bucket gets refilled',
1217                 optional => 1,
1218                 pattern => '[1-9][0-9]*\/(second|minute|hour|day)',
1219                 format_description => 'rate',
1220                 default => '1/second',
1221             },
1222             burst => {
1223                 type => 'integer',
1224                 minimum => 0,
1225                 optional => 1,
1226                 description => 'Inital burst of packages which will get logged',
1227                 default => 5,
1228             },
1229         },
1230         optional => 1,
1231     },
1232 };
1233
1234 our $host_option_properties = {
1235     enable => {
1236         description => "Enable host firewall rules.",
1237         type => 'boolean',
1238         optional => 1,
1239     },
1240     log_level_in =>  get_standard_option('pve-fw-loglevel', {
1241         description => "Log level for incoming traffic." }),
1242     log_level_out =>  get_standard_option('pve-fw-loglevel', {
1243         description => "Log level for outgoing traffic." }),
1244     tcp_flags_log_level =>  get_standard_option('pve-fw-loglevel', {
1245         description => "Log level for illegal tcp flags filter." }),
1246     smurf_log_level =>  get_standard_option('pve-fw-loglevel', {
1247         description => "Log level for SMURFS filter." }),
1248     nosmurfs => {
1249         description => "Enable SMURFS filter.",
1250         type => 'boolean',
1251         optional => 1,
1252     },
1253     tcpflags => {
1254         description => "Filter illegal combinations of TCP flags.",
1255         type => 'boolean',
1256         optional => 1,
1257     },
1258     nf_conntrack_max => {
1259         description => "Maximum number of tracked connections.",
1260         type => 'integer',
1261         optional => 1,
1262         minimum => 32768,
1263     },
1264     nf_conntrack_tcp_timeout_established => {
1265         description => "Conntrack established timeout.",
1266         type => 'integer',
1267         optional => 1,
1268         minimum => 7875,
1269     },
1270     ndp => {
1271         description => "Enable NDP.",
1272         type => 'boolean',
1273         optional => 1,
1274     },
1275     nf_conntrack_allow_invalid => {
1276         description => "Allow invalid packets on connection tracking.",
1277         type => 'boolean',
1278         default => 0,
1279         optional => 1,
1280     },
1281     log_nf_conntrack => {
1282         description => "Enable logging of conntrack information.",
1283         type => 'boolean',
1284         default => 0,
1285         optional => 1
1286     },
1287 };
1288
1289 our $vm_option_properties = {
1290     enable => {
1291         description => "Enable/disable firewall rules.",
1292         type => 'boolean',
1293         optional => 1,
1294     },
1295     macfilter => {
1296         description => "Enable/disable MAC address filter.",
1297         type => 'boolean',
1298         optional => 1,
1299     },
1300     dhcp => {
1301         description => "Enable DHCP.",
1302         type => 'boolean',
1303         optional => 1,
1304     },
1305     ndp => {
1306         description => "Enable NDP.",
1307         type => 'boolean',
1308         optional => 1,
1309     },
1310     radv => {
1311         description => "Allow sending Router Advertisement.",
1312         type => 'boolean',
1313         optional => 1,
1314     },
1315     ipfilter => {
1316         description => "Enable default IP filters. " .
1317            "This is equivalent to adding an empty ipfilter-net<id> ipset " .
1318            "for every interface. Such ipsets implicitly contain sane default " .
1319            "restrictions such as restricting IPv6 link local addresses to " .
1320            "the one derived from the interface's MAC address. For containers " .
1321            "the configured IP addresses will be implicitly added.",
1322         type => 'boolean',
1323         optional => 1,
1324     },
1325     policy_in => {
1326         description => "Input policy.",
1327         type => 'string',
1328         optional => 1,
1329         enum => ['ACCEPT', 'REJECT', 'DROP'],
1330     },
1331     policy_out => {
1332         description => "Output policy.",
1333         type => 'string',
1334         optional => 1,
1335         enum => ['ACCEPT', 'REJECT', 'DROP'],
1336     },
1337     log_level_in =>  get_standard_option('pve-fw-loglevel', {
1338         description => "Log level for incoming traffic." }),
1339     log_level_out =>  get_standard_option('pve-fw-loglevel', {
1340         description => "Log level for outgoing traffic." }),
1341
1342 };
1343
1344
1345 my $addr_list_descr = "This can refer to a single IP address, an IP set ('+ipsetname') or an IP alias definition. You can also specify an address range like '20.34.101.207-201.3.9.99', or a list of IP addresses and networks (entries are separated by comma). Please do not mix IPv4 and IPv6 addresses inside such lists.";
1346
1347 my $port_descr = "You can use service names or simple numbers (0-65535), as defined in '/etc/services'. Port ranges can be specified with '\\d+:\\d+', for example '80:85', and you can use comma separated list to match several ports or ranges.";
1348
1349 my $rule_properties = {
1350     pos => {
1351         description => "Update rule at position <pos>.",
1352         type => 'integer',
1353         minimum => 0,
1354         optional => 1,
1355     },
1356     digest => get_standard_option('pve-config-digest'),
1357     type => {
1358         description => "Rule type.",
1359         type => 'string',
1360         optional => 1,
1361         enum => ['in', 'out', 'group'],
1362     },
1363     action => {
1364         description => "Rule action ('ACCEPT', 'DROP', 'REJECT') or security group name.",
1365         type => 'string',
1366         optional => 1,
1367         pattern => $security_group_name_pattern,
1368         maxLength => 20,
1369         minLength => 2,
1370     },
1371     macro => {
1372         description => "Use predefined standard macro.",
1373         type => 'string',
1374         optional => 1,
1375         maxLength => 128,
1376     },
1377     iface => get_standard_option('pve-iface', {
1378         description => "Network interface name. You have to use network configuration key names for VMs and containers ('net\\d+'). Host related rules can use arbitrary strings.",
1379         optional => 1
1380     }),
1381     source => {
1382         description => "Restrict packet source address. $addr_list_descr",
1383         type => 'string', format => 'pve-fw-addr-spec',
1384         optional => 1,
1385     },
1386     dest => {
1387         description => "Restrict packet destination address. $addr_list_descr",
1388         type => 'string', format => 'pve-fw-addr-spec',
1389         optional => 1,
1390     },
1391     proto => {
1392         description => "IP protocol. You can use protocol names ('tcp'/'udp') or simple numbers, as defined in '/etc/protocols'.",
1393         type => 'string', format => 'pve-fw-protocol-spec',
1394         optional => 1,
1395     },
1396     enable => {
1397         description => "Flag to enable/disable a rule.",
1398         type => 'integer',
1399         minimum => 0,
1400         optional => 1,
1401     },
1402     log => get_standard_option('pve-fw-loglevel', {
1403         description => "Log level for firewall rule.",
1404     }),
1405     sport => {
1406         description => "Restrict TCP/UDP source port. $port_descr",
1407         type => 'string', format => 'pve-fw-sport-spec',
1408         optional => 1,
1409     },
1410     dport => {
1411         description => "Restrict TCP/UDP destination port. $port_descr",
1412         type => 'string', format => 'pve-fw-dport-spec',
1413         optional => 1,
1414     },
1415     comment => {
1416         description => "Descriptive comment.",
1417         type => 'string',
1418         optional => 1,
1419     },
1420 };
1421
1422 sub add_rule_properties {
1423     my ($properties) = @_;
1424
1425     foreach my $k (keys %$rule_properties) {
1426         my $h = $rule_properties->{$k};
1427         # copy data, so that we can modify later without side effects
1428         foreach my $opt (keys %$h) { $properties->{$k}->{$opt} = $h->{$opt}; }
1429     }
1430
1431     return $properties;
1432 }
1433
1434 sub delete_rule_properties {
1435     my ($rule, $delete_str) = @_;
1436
1437     foreach my $opt (PVE::Tools::split_list($delete_str)) {
1438         raise_param_exc({ 'delete' => "no such property ('$opt')"})
1439             if !defined($rule_properties->{$opt});
1440         raise_param_exc({ 'delete' => "unable to delete required property '$opt'"})
1441             if $opt eq 'type' || $opt eq 'action';
1442         delete $rule->{$opt};
1443     }
1444
1445     return $rule;
1446 }
1447
1448 my $apply_macro = sub {
1449     my ($macro_name, $param, $verify, $ipversion) = @_;
1450
1451     my $macro_rules = $pve_fw_parsed_macros->{$macro_name};
1452     die "unknown macro '$macro_name'\n" if !$macro_rules; # should not happen
1453
1454     if ($ipversion && ($ipversion == 6) && $pve_ipv6fw_macros->{$macro_name}) {
1455         $macro_rules = $pve_ipv6fw_macros->{$macro_name};
1456     }
1457
1458     # skip macros which are specific to another ipversion
1459     if ($ipversion && (my $required = $pve_fw_macro_ipversion->{$macro_name})) {
1460         return if $ipversion != $required;
1461     }
1462
1463     my $rules = [];
1464
1465     foreach my $templ (@$macro_rules) {
1466         my $rule = {};
1467         my $param_used = {};
1468         foreach my $k (keys %$templ) {
1469             my $v = $templ->{$k};
1470             if ($v eq 'PARAM') {
1471                 $v = $param->{$k};
1472                 $param_used->{$k} = 1;
1473             } elsif ($v eq 'DEST') {
1474                 $v = $param->{dest};
1475                 $param_used->{dest} = 1;
1476             } elsif ($v eq 'SOURCE') {
1477                 $v = $param->{source};
1478                 $param_used->{source} = 1;
1479             }
1480
1481             if (!defined($v)) {
1482                 my $msg = "missing parameter '$k' in macro '$macro_name'";
1483                 raise_param_exc({ macro => $msg }) if $verify;
1484                 die "$msg\n";
1485             }
1486             $rule->{$k} = $v;
1487         }
1488         foreach my $k (keys %$param) {
1489             next if $k eq 'macro';
1490             next if !defined($param->{$k});
1491             next if $param_used->{$k};
1492             if (defined($rule->{$k})) {
1493                 if ($rule->{$k} ne $param->{$k}) {
1494                     my $msg = "parameter '$k' already define in macro (value = '$rule->{$k}')";
1495                     raise_param_exc({ $k => $msg }) if $verify;
1496                     die "$msg\n";
1497                 }
1498             } else {
1499                 $rule->{$k} = $param->{$k};
1500             }
1501         }
1502         push @$rules, $rule;
1503     }
1504
1505     return $rules;
1506 };
1507
1508 my $rule_env_iface_lookup = {
1509     'ct' => 1,
1510     'vm' => 1,
1511     'group' => 0,
1512     'cluster' => 1,
1513     'host' => 1,
1514 };
1515
1516 sub verify_rule {
1517     my ($rule, $cluster_conf, $fw_conf, $rule_env, $noerr) = @_;
1518
1519     my $allow_groups = $rule_env eq 'group' ? 0 : 1;
1520
1521     my $allow_iface = $rule_env_iface_lookup->{$rule_env};
1522     die "unknown rule_env '$rule_env'\n" if !defined($allow_iface); # should not happen
1523
1524     my $errors = $rule->{errors} || {};
1525
1526     my $error_count = 0;
1527
1528     my $add_error = sub {
1529         my ($param, $msg)  = @_;
1530         chomp $msg;
1531         raise_param_exc({ $param => $msg }) if !$noerr;
1532         $error_count++;
1533         $errors->{$param} = $msg if !$errors->{$param};
1534     };
1535
1536     my $ipversion;
1537     my $set_ip_version = sub {
1538         my $vers = shift;
1539         if ($vers) {
1540             die "detected mixed ipv4/ipv6 adresses in rule\n"
1541                 if $ipversion && ($vers != $ipversion);
1542             $ipversion = $vers;
1543         }
1544     };
1545
1546     my $check_ipset_or_alias_property = sub {
1547         my ($name, $expected_ipversion) = @_;
1548
1549         if (my $value = $rule->{$name}) {
1550             if ($value =~ m/^\+/) {
1551                 if ($value =~ m/^\+(${ipset_name_pattern})$/) {
1552                     &$add_error($name, "no such ipset '$1'")
1553                         if !($cluster_conf->{ipset}->{$1} || ($fw_conf && $fw_conf->{ipset}->{$1}));
1554
1555                 } else {
1556                     &$add_error($name, "invalid ipset name '$value'");
1557                 }
1558             } elsif ($value =~ m/^${ip_alias_pattern}$/){
1559                 my $alias = lc($value);
1560                 &$add_error($name, "no such alias '$value'")
1561                     if !($cluster_conf->{aliases}->{$alias} || ($fw_conf && $fw_conf->{aliases}->{$alias}));
1562                 my $e = $fw_conf ? $fw_conf->{aliases}->{$alias} : undef;
1563                 $e = $cluster_conf->{aliases}->{$alias} if !$e && $cluster_conf;
1564
1565                 &$set_ip_version($e->{ipversion});
1566             }
1567         }
1568     };
1569
1570     my $type = $rule->{type};
1571     my $action = $rule->{action};
1572
1573     &$add_error('type', "missing property") if !$type;
1574     &$add_error('action', "missing property") if !$action;
1575
1576     if ($type) {
1577         if ($type eq  'in' || $type eq 'out') {
1578             &$add_error('action', "unknown action '$action'")
1579                 if $action && ($action !~ m/^(ACCEPT|DROP|REJECT)$/);
1580         } elsif ($type eq 'group') {
1581             &$add_error('type', "security groups not allowed")
1582                 if !$allow_groups;
1583             &$add_error('action', "invalid characters in security group name")
1584                 if $action && ($action !~ m/^${security_group_name_pattern}$/);
1585         } else {
1586             &$add_error('type', "unknown rule type '$type'");
1587         }
1588     }
1589
1590     if ($rule->{iface}) {
1591         &$add_error('type', "parameter -i not allowed for this rule type")
1592             if !$allow_iface;
1593         eval { PVE::JSONSchema::pve_verify_iface($rule->{iface}); };
1594         &$add_error('iface', $@) if $@;
1595         if ($rule_env eq 'vm' || $rule_env eq 'ct') {
1596             &$add_error('iface', "value does not match the regex pattern 'net\\d+'")
1597                 if $rule->{iface} !~  m/^net(\d+)$/;
1598         }
1599     }
1600
1601     if ($rule->{macro}) {
1602         if (my $preferred_name = $pve_fw_preferred_macro_names->{lc($rule->{macro})}) {
1603             $rule->{macro} = $preferred_name;
1604         } else {
1605             &$add_error('macro', "unknown macro '$rule->{macro}'");
1606         }
1607     }
1608
1609     if ($rule->{proto}) {
1610         eval { pve_fw_verify_protocol_spec($rule->{proto}); };
1611         &$add_error('proto', $@) if $@;
1612         &$set_ip_version(4) if $rule->{proto} eq 'icmp';
1613         &$set_ip_version(6) if $rule->{proto} eq 'icmpv6';
1614     }
1615
1616     if ($rule->{dport}) {
1617         eval { parse_port_name_number_or_range($rule->{dport}, 1); };
1618         &$add_error('dport', $@) if $@;
1619         my $proto = $rule->{proto};
1620         &$add_error('proto', "missing property - 'dport' requires this property")
1621             if !$proto;
1622         &$add_error('dport', "protocol '$proto' does not support ports")
1623             if !$PROTOCOLS_WITH_PORTS->{$proto} &&
1624                 $proto ne 'icmp' && $proto ne 'icmpv6'; # special cases
1625     }
1626
1627     if ($rule->{sport}) {
1628         eval { parse_port_name_number_or_range($rule->{sport}, 0); };
1629         &$add_error('sport', $@) if $@;
1630         my $proto = $rule->{proto};
1631         &$add_error('proto', "missing property - 'sport' requires this property")
1632             if !$proto;
1633         &$add_error('sport', "protocol '$proto' does not support ports")
1634             if !$PROTOCOLS_WITH_PORTS->{$proto};
1635     }
1636
1637     if ($rule->{source}) {
1638         eval { 
1639             my $source_ipversion = parse_address_list($rule->{source});
1640             &$set_ip_version($source_ipversion);
1641         };
1642         &$add_error('source', $@) if $@;
1643         &$check_ipset_or_alias_property('source', $ipversion);
1644     }
1645
1646     if ($rule->{dest}) {
1647         eval { 
1648             my $dest_ipversion = parse_address_list($rule->{dest}); 
1649             &$set_ip_version($dest_ipversion);
1650         };
1651         &$add_error('dest', $@) if $@;
1652         &$check_ipset_or_alias_property('dest', $ipversion);
1653     }
1654
1655     $rule->{ipversion} = $ipversion if $ipversion;
1656
1657     if ($rule->{macro} && !$error_count) {
1658         eval { &$apply_macro($rule->{macro}, $rule, 1, $ipversion); };
1659         if (my $err = $@) {
1660             if (ref($err) eq "PVE::Exception" && $err->{errors}) {
1661                 my $eh = $err->{errors};
1662                 foreach my $p (keys %$eh) {
1663                     &$add_error($p, $eh->{$p});
1664                 }
1665             } else {
1666                 &$add_error('macro', "$err");
1667             }
1668         }
1669     }
1670
1671     $rule->{errors} = $errors if $error_count;
1672
1673     return $rule;
1674 }
1675
1676 sub copy_rule_data {
1677     my ($rule, $param) = @_;
1678
1679     foreach my $k (keys %$rule_properties) {
1680         if (defined(my $v = $param->{$k})) {
1681             if ($v eq '' || $v eq '-') {
1682                 delete $rule->{$k};
1683             } else {
1684                 $rule->{$k} = $v;
1685             }
1686         }
1687     }
1688
1689     return $rule;
1690 }
1691
1692 sub rules_modify_permissions {
1693     my ($rule_env) = @_;
1694
1695     if ($rule_env eq 'host') {
1696         return {
1697             check => ['perm', '/nodes/{node}', [ 'Sys.Modify' ]],
1698         };
1699     } elsif ($rule_env eq 'cluster' || $rule_env eq 'group') {
1700         return {
1701             check => ['perm', '/', [ 'Sys.Modify' ]],
1702         };
1703     } elsif ($rule_env eq 'vm' || $rule_env eq 'ct') {
1704         return {
1705             check => ['perm', '/vms/{vmid}', [ 'VM.Config.Network' ]],
1706         }
1707     }
1708
1709     return undef;
1710 }
1711
1712 sub rules_audit_permissions {
1713     my ($rule_env) = @_;
1714
1715     if ($rule_env eq 'host') {
1716         return {
1717             check => ['perm', '/nodes/{node}', [ 'Sys.Audit' ]],
1718         };
1719     } elsif ($rule_env eq 'cluster' || $rule_env eq 'group') {
1720         return {
1721             check => ['perm', '/', [ 'Sys.Audit' ]],
1722         };
1723     } elsif ($rule_env eq 'vm' || $rule_env eq 'ct') {
1724         return {
1725             check => ['perm', '/vms/{vmid}', [ 'VM.Audit' ]],
1726         }
1727     }
1728
1729     return undef;
1730 }
1731
1732 # core functions
1733 my $bridge_firewall_enabled = 0;
1734
1735 sub enable_bridge_firewall {
1736
1737     return if $bridge_firewall_enabled; # only once
1738
1739     PVE::ProcFSTools::write_proc_entry("/proc/sys/net/bridge/bridge-nf-call-iptables", "1");
1740     PVE::ProcFSTools::write_proc_entry("/proc/sys/net/bridge/bridge-nf-call-ip6tables", "1");
1741
1742     # make sure syncookies are enabled (which is default on newer 3.X kernels anyways)
1743     PVE::ProcFSTools::write_proc_entry("/proc/sys/net/ipv4/tcp_syncookies", "1");
1744
1745     $bridge_firewall_enabled = 1;
1746 }
1747
1748 sub iptables_restore_cmdlist {
1749     my ($cmdlist) = @_;
1750
1751     run_command("/sbin/iptables-restore -n", input => $cmdlist, errmsg => "iptables_restore_cmdlist");
1752 }
1753
1754 sub ip6tables_restore_cmdlist {
1755     my ($cmdlist) = @_;
1756
1757     run_command("/sbin/ip6tables-restore -n", input => $cmdlist, errmsg => "iptables_restore_cmdlist");
1758 }
1759
1760 sub ipset_restore_cmdlist {
1761     my ($cmdlist) = @_;
1762
1763     run_command("/sbin/ipset restore", input => $cmdlist, errmsg => "ipset_restore_cmdlist");
1764 }
1765
1766 sub ebtables_restore_cmdlist {
1767     my ($cmdlist) = @_;
1768
1769     run_command("/sbin/ebtables-restore", input => $cmdlist, errmsg => "ebtables_restore_cmdlist");
1770 }
1771
1772 sub iptables_get_chains {
1773     my ($iptablescmd) = @_;
1774
1775     $iptablescmd = "iptables" if !$iptablescmd;
1776
1777     my $res = {};
1778
1779     # check what chains we want to track
1780     my $is_pvefw_chain = sub {
1781         my $name = shift;
1782
1783         return 1 if $name =~ m/^PVEFW-\S+$/;
1784
1785         return 1 if $name =~ m/^tap\d+i\d+-(?:IN|OUT)$/;
1786
1787         return 1 if $name =~ m/^veth\d+i\d+-(?:IN|OUT)$/;
1788
1789         return 1 if $name =~ m/^fwbr\d+(v\d+)?-(?:FW|IN|OUT|IPS)$/;
1790         return 1 if $name =~ m/^GROUP-(?:$security_group_name_pattern)-(?:IN|OUT)$/;
1791
1792         return undef;
1793     };
1794
1795     my $table = '';
1796
1797     my $hooks = {};
1798
1799     my $parser = sub {
1800         my $line = shift;
1801
1802         return if $line =~ m/^#/;
1803         return if $line =~ m/^\s*$/;
1804
1805         if ($line =~ m/^\*(\S+)$/) {
1806             $table = $1;
1807             return;
1808         }
1809
1810         return if $table ne 'filter';
1811
1812         if ($line =~ m/^:(\S+)\s/) {
1813             my $chain = $1;
1814             return if !&$is_pvefw_chain($chain);
1815             $res->{$chain} = "unknown";
1816         } elsif ($line =~ m/^-A\s+(\S+)\s.*--comment\s+\"PVESIG:(\S+)\"/) {
1817             my ($chain, $sig) = ($1, $2);
1818             return if !&$is_pvefw_chain($chain);
1819             $res->{$chain} = $sig;
1820         } elsif ($line =~ m/^-A\s+(INPUT|OUTPUT|FORWARD)\s+-j\s+PVEFW-\1$/) {
1821             $hooks->{$1} = 1;
1822         } else {
1823             # simply ignore the rest
1824             return;
1825         }
1826     };
1827
1828     run_command("/sbin/$iptablescmd-save", outfunc => $parser);
1829
1830     return wantarray ? ($res, $hooks) : $res;
1831 }
1832
1833 sub iptables_chain_digest {
1834     my ($rules) = @_;
1835     my $digest = Digest::SHA->new('sha1');
1836     foreach my $rule (@$rules) { # order is important
1837         $digest->add($rule);
1838     }
1839     return $digest->b64digest;
1840 }
1841
1842 sub ipset_chain_digest {
1843     my ($rules) = @_;
1844
1845     my $digest = Digest::SHA->new('sha1');
1846     foreach my $rule (sort @$rules) { # note: sorted
1847         $digest->add($rule);
1848     }
1849     return $digest->b64digest;
1850 }
1851
1852 sub ipset_get_chains {
1853
1854     my $res = {};
1855     my $chains = {};
1856
1857     my $parser = sub {
1858         my $line = shift;
1859
1860         return if $line =~ m/^#/;
1861         return if $line =~ m/^\s*$/;
1862         if ($line =~ m/^(?:\S+)\s(PVEFW-\S+)\s(?:\S+).*/) {
1863             my $chain = $1;
1864             $line =~ s/\s+$//; # delete trailing white space
1865             push @{$chains->{$chain}}, $line;
1866         } else {
1867             # simply ignore the rest
1868             return;
1869         }
1870     };
1871
1872     run_command("/sbin/ipset save", outfunc => $parser);
1873
1874     # compute digest for each chain
1875     foreach my $chain (keys %$chains) {
1876         $res->{$chain} = ipset_chain_digest($chains->{$chain});
1877     }
1878
1879     return $res;
1880 }
1881
1882 sub ebtables_get_chains {
1883
1884     my $res = {};
1885     my $chains = {};
1886     my $parser = sub {
1887         my $line = shift;
1888         return if $line =~ m/^#/;
1889         return if $line =~ m/^\s*$/;
1890         if ($line =~ m/^:(\S+)\s\S+$/) {
1891             # Make sure we know chains exist even if they're empty.
1892             $chains->{$1} //= [];
1893         } elsif ($line =~ m/^(?:\S+)\s(\S+)\s(?:\S+).*/) {
1894             my $chain = $1;
1895             $line =~ s/\s+$//;
1896             push @{$chains->{$chain}}, $line;
1897         } else {
1898             # simply ignore the rest
1899             return;
1900         }
1901     };
1902
1903     run_command("/sbin/ebtables-save", outfunc => $parser);
1904     # compute digest for each chain and store rules as well
1905     foreach my $chain (keys %$chains) {
1906         $res->{$chain}->{rules} = $chains->{$chain};
1907         $res->{$chain}->{sig} = iptables_chain_digest($chains->{$chain});
1908     }
1909     return $res;
1910 }
1911
1912 # substitude action of rule according to action hash
1913 sub rule_substitude_action {
1914     my ($rule, $actions) = @_;
1915
1916     if (my $action = $rule->{action}) {
1917         $rule->{action} = $actions->{$action} if defined($actions->{$action});
1918     }
1919 }
1920
1921 # generate a src or dst match
1922 # $dir(ection) is either d or s
1923 sub ipt_gen_src_or_dst_match {
1924     my ($adr, $dir, $ipversion, $cluster_conf, $fw_conf) = @_;
1925
1926     my $srcdst;
1927     if ($dir eq 's') {
1928         $srcdst = "src";
1929     } elsif ($dir eq 'd') {
1930         $srcdst = "dst";
1931     } else {
1932         die "ipt_gen_src_or_dst_match: invalid direction $dir \n";
1933     }
1934
1935     my $match;
1936     if ($adr =~ m/^\+/) {
1937         if ($adr =~ m/^\+(${ipset_name_pattern})$/) {
1938             my $name = $1;
1939             my $ipset_chain;
1940             if ($fw_conf && $fw_conf->{ipset}->{$name}) {
1941                 $ipset_chain = compute_ipset_chain_name($fw_conf->{vmid}, $name, $ipversion);
1942             } elsif ($cluster_conf && $cluster_conf->{ipset}->{$name}) {
1943                 $ipset_chain = compute_ipset_chain_name(0, $name, $ipversion);
1944             } else {
1945                 die "no such ipset '$name'\n";
1946             }
1947             $match = "-m set --match-set ${ipset_chain} ${srcdst}";
1948         } else {
1949             die "invalid security group name '$adr'\n";
1950         }
1951     } elsif ($adr =~ m/^${ip_alias_pattern}$/){
1952         my $alias = lc($adr);
1953         my $e = $fw_conf ? $fw_conf->{aliases}->{$alias} : undef;
1954         $e = $cluster_conf->{aliases}->{$alias} if !$e && $cluster_conf;
1955         die "no such alias '$adr'\n" if !$e;
1956         $match = "-${dir} $e->{cidr}";
1957     } elsif ($adr =~ m/\-/){
1958         $match = "-m iprange --${srcdst}-range $adr";
1959     } else {
1960         $match = "-${dir} $adr";
1961     }
1962
1963     return $match;
1964 }
1965
1966 # convert a %rule to an array of iptables commands
1967 sub ipt_rule_to_cmds {
1968     my ($rule, $chain, $ipversion, $cluster_conf, $fw_conf, $vmid) = @_;
1969
1970     die "ipt_rule_to_cmds unable to handle macro" if $rule->{macro}; #should not happen
1971
1972     my @match = ();
1973
1974     if (defined $rule->{match}) {
1975         push @match, $rule->{match};
1976     } else {
1977         push @match, "-i $rule->{iface_in}" if $rule->{iface_in};
1978         push @match, "-o $rule->{iface_out}" if $rule->{iface_out};
1979
1980         if ($rule->{source}) {
1981             push @match, ipt_gen_src_or_dst_match($rule->{source}, 's', $ipversion, $cluster_conf, $fw_conf);
1982         }
1983         if ($rule->{dest}) {
1984             push @match, ipt_gen_src_or_dst_match($rule->{dest}, 'd', $ipversion, $cluster_conf, $fw_conf);
1985         }
1986
1987         if (my $proto = $rule->{proto}) {
1988             push @match, "-p $proto";
1989
1990             my $multidport = defined($rule->{dport}) && parse_port_name_number_or_range($rule->{dport}, 1);
1991             my $multisport = defined($rule->{sport}) && parse_port_name_number_or_range($rule->{sport}, 0);
1992
1993             my $add_dport = sub {
1994                 return if !$rule->{dport};
1995
1996                 if ($proto eq 'icmp') {
1997                     # Note: we use dport to store --icmp-type
1998                     die "unknown icmp-type '$rule->{dport}'\n"
1999                         if $rule->{dport} !~ /^\d+$/ && !defined($icmp_type_names->{$rule->{dport}});
2000                     push @match, "-m icmp --icmp-type $rule->{dport}";
2001                 } elsif ($proto eq 'icmpv6') {
2002                     # Note: we use dport to store --icmpv6-type
2003                     die "unknown icmpv6-type '$rule->{dport}'\n"
2004                         if $rule->{dport} !~ /^\d+$/ && !defined($icmpv6_type_names->{$rule->{dport}});
2005                     push @match, "-m icmpv6 --icmpv6-type $rule->{dport}";
2006                 } elsif (!$PROTOCOLS_WITH_PORTS->{$proto}) {
2007                     die "protocol $proto does not have ports\n";
2008                 } elsif ($multidport) {
2009                     push @match, "--match multiport", "--dports $rule->{dport}";
2010                 } else {
2011                     push @match, "--dport $rule->{dport}";
2012                 }
2013             };
2014
2015             my $add_sport = sub {
2016                 return if !$rule->{sport};
2017
2018                 die "protocol $proto does not have ports\n"
2019                     if !$PROTOCOLS_WITH_PORTS->{$proto};
2020                 if ($multisport) {
2021                     push @match, "--match multiport", "--sports $rule->{sport}";
2022                 } else {
2023                     push @match, "--sport $rule->{sport}";
2024                 }
2025             };
2026
2027             # order matters - single port before multiport!
2028             $add_dport->() if $multisport;
2029             $add_sport->();
2030             $add_dport->() if !$multisport;
2031         } elsif ($rule->{dport} || $rule->{sport}) {
2032             die "destination port '$rule->{dport}', but no protocol specified\n" if $rule->{dport};
2033             die "source port '$rule->{sport}', but no protocol specified\n" if $rule->{sport};
2034         }
2035
2036         push @match, "-m addrtype --dst-type $rule->{dsttype}" if $rule->{dsttype};
2037     }
2038     my $matchstr = scalar(@match) ? join(' ', @match) : "";
2039
2040     my $targetstr;
2041     if (defined $rule->{target}) {
2042         $targetstr = $rule->{target};
2043     } else {
2044         my $action = (defined $rule->{action}) ? $rule->{action} : "";
2045         my $goto = 1 if $action eq 'PVEFW-SET-ACCEPT-MARK';
2046         $targetstr = ($goto) ? "-g $action" : "-j $action";
2047     }
2048
2049     my @iptcmds;
2050     my $log = $rule->{log};
2051     if (defined($log) && $log ne 'nolog') {
2052         my $loglevel = $log_level_hash->{$log};
2053         my $logaction = get_log_rule_base($chain, $vmid, $rule->{logmsg}, $loglevel);
2054         push @iptcmds, "-A $chain $matchstr $logaction";
2055     }
2056     push @iptcmds, "-A $chain $matchstr $targetstr";
2057     return @iptcmds;
2058 }
2059
2060 sub ruleset_generate_rule {
2061     my ($ruleset, $chain, $ipversion, $rule, $cluster_conf, $fw_conf, $vmid) = @_;
2062
2063     my $rules;
2064
2065     if ($rule->{macro}) {
2066         $rules = &$apply_macro($rule->{macro}, $rule, 0, $ipversion);
2067     } else {
2068         $rules = [ $rule ];
2069     }
2070
2071     # update all or nothing
2072     my @ipt_rule_cmds;
2073     foreach my $r (@$rules) {
2074         push @ipt_rule_cmds, ipt_rule_to_cmds($r, $chain, $ipversion, $cluster_conf, $fw_conf, $vmid);
2075     }
2076     foreach my $c (@ipt_rule_cmds) {
2077         ruleset_add_ipt_cmd($ruleset, $chain, $c);
2078     }
2079 }
2080
2081 sub ruleset_create_chain {
2082     my ($ruleset, $chain) = @_;
2083
2084     die "Invalid chain name '$chain' (28 char max)\n" if length($chain) > 28;
2085     die "chain name may not contain collons\n" if $chain =~ m/:/; # because of log format
2086
2087     die "chain '$chain' already exists\n" if $ruleset->{$chain};
2088
2089     $ruleset->{$chain} = [];
2090 }
2091
2092 sub ruleset_chain_exist {
2093     my ($ruleset, $chain) = @_;
2094
2095     return $ruleset->{$chain} ? 1 : undef;
2096 }
2097
2098 # add an iptables command (like generated by ipt_rule_to_cmds) to a chain
2099 sub ruleset_add_ipt_cmd {
2100    my ($ruleset, $chain, $iptcmd) = @_;
2101
2102    die "no such chain '$chain'\n" if !$ruleset->{$chain};
2103
2104    push @{$ruleset->{$chain}}, $iptcmd;
2105 }
2106
2107 sub ruleset_addrule {
2108     my ($ruleset, $chain, $match, $action, $log, $logmsg, $vmid) = @_;
2109
2110     die "no such chain '$chain'\n" if !$ruleset->{$chain};
2111
2112     if ($log) {
2113         my $loglevel = $log_level_hash->{$log};
2114         my $logaction = get_log_rule_base($chain, $vmid, $logmsg, $loglevel);
2115         push @{$ruleset->{$chain}}, "-A $chain $match $logaction";
2116     }
2117     # for stable ebtables digests avoid double-spaces to match ebtables-save output
2118     $match .= ' ' if length($match);
2119     push @{$ruleset->{$chain}}, "-A $chain ${match}$action";
2120 }
2121
2122 sub ruleset_insertrule {
2123    my ($ruleset, $chain, $match, $action, $log) = @_;
2124
2125    die "no such chain '$chain'\n" if !$ruleset->{$chain};
2126
2127    unshift @{$ruleset->{$chain}}, "-A $chain $match $action";
2128 }
2129
2130 sub get_log_rule_base {
2131     my ($chain, $vmid, $msg, $loglevel) = @_;
2132
2133     $vmid = 0 if !defined($vmid);
2134     $msg = "" if !defined($msg);
2135
2136     my $rlimit = '';
2137     if (defined($global_log_ratelimit)) {
2138         $rlimit = "-m limit $global_log_ratelimit ";
2139     }
2140
2141     # Note: we use special format for prefix to pass further
2142     # info to log daemon (VMID, LOGLEVEL and CHAIN)
2143     return "${rlimit}-j NFLOG --nflog-prefix \":$vmid:$loglevel:$chain: $msg\"";
2144 }
2145
2146 sub ruleset_add_chain_policy {
2147     my ($ruleset, $chain, $ipversion, $vmid, $policy, $loglevel, $accept_action) = @_;
2148
2149     if ($policy eq 'ACCEPT') {
2150
2151         my $rule = { action => 'ACCEPT' };
2152         rule_substitude_action($rule, { ACCEPT =>  $accept_action});
2153         ruleset_generate_rule($ruleset, $chain, $ipversion, $rule);
2154
2155     } elsif ($policy eq 'DROP') {
2156
2157         ruleset_addrule($ruleset, $chain, "", "-j PVEFW-Drop");
2158
2159         ruleset_addrule($ruleset, $chain, "", "-j DROP", $loglevel, "policy $policy: ", $vmid);
2160     } elsif ($policy eq 'REJECT') {
2161         ruleset_addrule($ruleset, $chain, "", "-j PVEFW-Reject");
2162
2163         ruleset_addrule($ruleset, $chain, "", "-g PVEFW-reject", $loglevel, "policy $policy: ", $vmid);
2164     } else {
2165         # should not happen
2166         die "internal error: unknown policy '$policy'";
2167     }
2168 }
2169
2170 sub ruleset_chain_add_ndp {
2171     my ($ruleset, $chain, $ipversion, $options, $direction, $accept) = @_;
2172     return if $ipversion != 6 || (defined($options->{ndp}) && !$options->{ndp});
2173
2174     ruleset_addrule($ruleset, $chain, "-p icmpv6 --icmpv6-type router-solicitation", $accept);
2175     if ($direction ne 'OUT' || $options->{radv}) {
2176         ruleset_addrule($ruleset, $chain, "-p icmpv6 --icmpv6-type router-advertisement", $accept);
2177     }
2178     ruleset_addrule($ruleset, $chain, "-p icmpv6 --icmpv6-type neighbor-solicitation", $accept);
2179     ruleset_addrule($ruleset, $chain, "-p icmpv6 --icmpv6-type neighbor-advertisement", $accept);
2180 }
2181
2182 sub ruleset_chain_add_conn_filters {
2183     my ($ruleset, $chain, $allow_invalid, $accept) = @_;
2184
2185     if (!$allow_invalid) {
2186         ruleset_addrule($ruleset, $chain, "-m conntrack --ctstate INVALID", "-j DROP");
2187     }
2188     ruleset_addrule($ruleset, $chain, "-m conntrack --ctstate RELATED,ESTABLISHED", "-j $accept");
2189 }
2190
2191 sub ruleset_chain_add_input_filters {
2192     my ($ruleset, $chain, $ipversion, $options, $cluster_conf, $loglevel) = @_;
2193
2194     if ($cluster_conf->{ipset}->{blacklist}){
2195         if (!ruleset_chain_exist($ruleset, "PVEFW-blacklist")) {
2196             ruleset_create_chain($ruleset, "PVEFW-blacklist");
2197             ruleset_addrule($ruleset, "PVEFW-blacklist", "", "-j DROP", $loglevel, "DROP: ", 0);
2198         }
2199         my $ipset_chain = compute_ipset_chain_name(0, 'blacklist', $ipversion);
2200         ruleset_addrule($ruleset, $chain, "-m set --match-set ${ipset_chain} src", "-j PVEFW-blacklist");
2201     }
2202
2203     if (!(defined($options->{nosmurfs}) && $options->{nosmurfs} == 0)) {
2204         if ($ipversion == 4) {
2205             ruleset_addrule($ruleset, $chain, "-m conntrack --ctstate INVALID,NEW", "-j PVEFW-smurfs");
2206         }
2207     }
2208
2209     if ($options->{tcpflags}) {
2210         ruleset_addrule($ruleset, $chain, "-p tcp", "-j PVEFW-tcpflags");
2211     }
2212 }
2213
2214 sub ruleset_create_vm_chain {
2215     my ($ruleset, $chain, $ipversion, $options, $macaddr, $ipfilter_ipset, $direction) = @_;
2216
2217     ruleset_create_chain($ruleset, $chain);
2218     my $accept = generate_nfqueue($options);
2219
2220     if (!(defined($options->{dhcp}) && $options->{dhcp} == 0)) {
2221         if ($ipversion == 4) {
2222             if ($direction eq 'OUT') {
2223                 ruleset_generate_rule($ruleset, $chain, $ipversion, 
2224                                       { action => 'PVEFW-SET-ACCEPT-MARK',
2225                                         proto => 'udp', sport => 68, dport => 67 });
2226             } else {
2227                 ruleset_generate_rule($ruleset, $chain, $ipversion,
2228                                       { action => 'ACCEPT',
2229                                         proto => 'udp', sport => 67, dport => 68 });
2230             }
2231         } elsif ($ipversion == 6) {
2232             if ($direction eq 'OUT') {
2233                 ruleset_generate_rule($ruleset, $chain, $ipversion,
2234                                       { action => 'PVEFW-SET-ACCEPT-MARK',
2235                                         proto => 'udp', sport => 546, dport => 547 });
2236             } else {
2237                 ruleset_generate_rule($ruleset, $chain, $ipversion,
2238                                       { action => 'ACCEPT',
2239                                         proto => 'udp', sport => 547, dport => 546 });
2240             }
2241         }
2242
2243     }
2244
2245     if ($direction eq 'OUT') {
2246         if (defined($macaddr) && !(defined($options->{macfilter}) && $options->{macfilter} == 0)) {
2247             ruleset_addrule($ruleset, $chain, "-m mac ! --mac-source $macaddr", "-j DROP");
2248         }
2249         if ($ipversion == 6 && !$options->{radv}) {
2250             ruleset_addrule($ruleset, $chain, "-p icmpv6 --icmpv6-type router-advertisement", "-j DROP");
2251         }
2252         if ($ipfilter_ipset) {
2253             ruleset_addrule($ruleset, $chain, "-m set ! --match-set $ipfilter_ipset src", "-j DROP");
2254         }
2255         ruleset_addrule($ruleset, $chain, "", "-j MARK --set-mark $FWACCEPTMARK_OFF"); # clear mark
2256     }
2257
2258     my $accept_action = $direction eq 'OUT' ? '-g PVEFW-SET-ACCEPT-MARK' : "-j $accept";
2259     ruleset_chain_add_ndp($ruleset, $chain, $ipversion, $options, $direction, $accept_action);
2260 }
2261
2262 sub ruleset_add_group_rule {
2263     my ($ruleset, $cluster_conf, $chain, $rule, $direction, $action, $ipversion) = @_;
2264
2265     my $group = $rule->{action};
2266     my $group_chain = "GROUP-$group-$direction";
2267     if(!ruleset_chain_exist($ruleset, $group_chain)){
2268         generate_group_rules($ruleset, $cluster_conf, $group, $ipversion);
2269     }
2270
2271     if ($direction eq 'OUT' && $rule->{iface_out}) {
2272         ruleset_addrule($ruleset, $chain, "-o $rule->{iface_out}", "-j $group_chain");
2273     } elsif ($direction eq 'IN' && $rule->{iface_in}) {
2274         ruleset_addrule($ruleset, $chain, "-i $rule->{iface_in}", "-j $group_chain");
2275     } else {
2276         ruleset_addrule($ruleset, $chain, "", "-j $group_chain");
2277     }
2278
2279     ruleset_addrule($ruleset, $chain, "-m mark --mark $FWACCEPTMARK_ON", "-j $action");
2280 }
2281
2282 sub ruleset_generate_vm_rules {
2283     my ($ruleset, $rules, $cluster_conf, $vmfw_conf, $chain, $netid, $direction, $options, $ipversion, $vmid) = @_;
2284
2285     my $lc_direction = lc($direction);
2286
2287     my $in_accept = generate_nfqueue($options);
2288
2289     foreach my $rule (@$rules) {
2290         next if $rule->{iface} && $rule->{iface} ne $netid;
2291         next if !$rule->{enable} || $rule->{errors};
2292         next if $rule->{ipversion} && ($rule->{ipversion} != $ipversion);
2293
2294         if ($rule->{type} eq 'group') {
2295             ruleset_add_group_rule($ruleset, $cluster_conf, $chain, $rule, $direction,
2296                                    $direction eq 'OUT' ? 'RETURN' : $in_accept, $ipversion);
2297         } else {
2298             next if $rule->{type} ne $lc_direction;
2299             eval {
2300                 $rule->{logmsg} = "$rule->{action}: ";
2301                 if ($direction eq 'OUT') {
2302                     rule_substitude_action($rule, { ACCEPT => "PVEFW-SET-ACCEPT-MARK", REJECT => "PVEFW-reject" });
2303                     ruleset_generate_rule($ruleset, $chain, $ipversion, $rule, $cluster_conf, $vmfw_conf, $vmid);
2304                 } else {
2305                     rule_substitude_action($rule, { ACCEPT => $in_accept , REJECT => "PVEFW-reject" });
2306                     ruleset_generate_rule($ruleset, $chain, $ipversion, $rule, $cluster_conf, $vmfw_conf, $vmid);
2307                 }
2308             };
2309             warn $@ if $@;
2310         }
2311     }
2312 }
2313
2314 sub generate_nfqueue {
2315     my ($options) = @_;
2316
2317     if ($options->{ips}) {
2318         my $action = "NFQUEUE";
2319         if ($options->{ips_queues} && $options->{ips_queues} =~ m/^(\d+)(:(\d+))?$/) {
2320             if (defined($3) && defined($1)) {
2321                 $action .= " --queue-balance $1:$3";
2322             } elsif (defined($1)) {
2323                 $action .= " --queue-num $1";
2324             }
2325         }
2326         $action .= " --queue-bypass" if $feature_ipset_nomatch; #need kernel 3.10
2327         return $action;
2328     } else {
2329         return "ACCEPT";
2330     }
2331 }
2332
2333 sub ruleset_generate_vm_ipsrules {
2334     my ($ruleset, $options, $direction, $iface) = @_;
2335
2336     if ($options->{ips} && $direction eq 'IN') {
2337         my $nfqueue = generate_nfqueue($options);
2338
2339         if (!ruleset_chain_exist($ruleset, "PVEFW-IPS")) {
2340             ruleset_create_chain($ruleset, "PVEFW-IPS");
2341         }
2342
2343         ruleset_addrule($ruleset, "PVEFW-IPS", "-m physdev --physdev-out $iface --physdev-is-bridged", "-j $nfqueue");
2344     }
2345 }
2346
2347 sub generate_tap_rules_direction {
2348     my ($ruleset, $cluster_conf, $iface, $netid, $macaddr, $vmfw_conf, $vmid, $direction, $ipversion) = @_;
2349
2350     my $lc_direction = lc($direction);
2351
2352     my $rules = $vmfw_conf->{rules};
2353
2354     my $options = $vmfw_conf->{options};
2355     my $loglevel = get_option_log_level($options, "log_level_${lc_direction}");
2356
2357     my $tapchain = "$iface-$direction";
2358
2359     my $ipfilter_name = compute_ipfilter_ipset_name($netid);
2360     my $ipfilter_ipset = compute_ipset_chain_name($vmid, $ipfilter_name, $ipversion)
2361         if $options->{ipfilter} || $vmfw_conf->{ipset}->{$ipfilter_name};
2362
2363     # create chain with mac and ip filter
2364     ruleset_create_vm_chain($ruleset, $tapchain, $ipversion, $options, $macaddr, $ipfilter_ipset, $direction);
2365
2366     if ($options->{enable}) {
2367         ruleset_generate_vm_rules($ruleset, $rules, $cluster_conf, $vmfw_conf, $tapchain, $netid, $direction, $options, $ipversion, $vmid);
2368
2369         ruleset_generate_vm_ipsrules($ruleset, $options, $direction, $iface);
2370
2371         # implement policy
2372         my $policy;
2373
2374         if ($direction eq 'OUT') {
2375             $policy = $options->{policy_out} || 'ACCEPT'; # allow everything by default
2376         } else {
2377             $policy = $options->{policy_in} || 'DROP'; # allow nothing by default
2378         }
2379
2380         my $accept = generate_nfqueue($options);
2381         my $accept_action = $direction eq 'OUT' ? "PVEFW-SET-ACCEPT-MARK" : $accept;
2382         ruleset_add_chain_policy($ruleset, $tapchain, $ipversion, $vmid, $policy, $loglevel, $accept_action);
2383     } else {
2384         my $accept_action = $direction eq 'OUT' ? "PVEFW-SET-ACCEPT-MARK" : 'ACCEPT';
2385         ruleset_add_chain_policy($ruleset, $tapchain, $ipversion, $vmid, 'ACCEPT', $loglevel, $accept_action);
2386     }
2387
2388     # plug the tap chain to bridge chain
2389     if ($direction eq 'IN') {
2390         ruleset_addrule($ruleset, "PVEFW-FWBR-IN",
2391                         "-m physdev --physdev-is-bridged --physdev-out $iface", "-j $tapchain");
2392     } else {
2393         ruleset_addrule($ruleset, "PVEFW-FWBR-OUT",
2394                         "-m physdev --physdev-is-bridged --physdev-in $iface", "-j $tapchain");
2395     }
2396 }
2397
2398 sub enable_host_firewall {
2399     my ($ruleset, $hostfw_conf, $cluster_conf, $ipversion, $corosync_conf) = @_;
2400
2401     my $options = $hostfw_conf->{options};
2402     my $cluster_options = $cluster_conf->{options};
2403     my $rules = $hostfw_conf->{rules};
2404     my $cluster_rules = $cluster_conf->{rules};
2405
2406     # corosync preparation
2407     my $corosync_rule = "-p udp --dport 5404:5405";
2408     my $corosync_local_addresses = {};
2409     my $multicast_enabled;
2410     my $local_hostname = PVE::INotify::nodename();
2411     if (defined($corosync_conf)) {
2412         PVE::Corosync::for_all_corosync_addresses($corosync_conf, $ipversion, sub {
2413             my ($node_name, $node_ip, $node_ipversion, $key) = @_;
2414
2415             if ($node_name eq $local_hostname) {
2416                 $corosync_local_addresses->{$key} = $node_ip;
2417             }
2418         });
2419
2420         # allow multicast only if enabled in config
2421         my $corosync_transport = $corosync_conf->{main}->{totem}->{transport};
2422         $multicast_enabled = defined($corosync_transport) && $corosync_transport eq 'udp';
2423     }
2424
2425     # host inbound firewall
2426     my $chain = "PVEFW-HOST-IN";
2427     ruleset_create_chain($ruleset, $chain);
2428
2429     my $loglevel = get_option_log_level($options, "log_level_in");
2430
2431     ruleset_addrule($ruleset, $chain, "-i lo", "-j ACCEPT");
2432
2433     ruleset_chain_add_conn_filters($ruleset, $chain, 0, 'ACCEPT');
2434     ruleset_chain_add_ndp($ruleset, $chain, $ipversion, $options, 'IN', '-j RETURN');
2435     ruleset_chain_add_input_filters($ruleset, $chain, $ipversion, $options, $cluster_conf, $loglevel);
2436
2437     # we use RETURN because we need to check also tap rules
2438     my $accept_action = 'RETURN';
2439
2440     ruleset_addrule($ruleset, $chain, "-p igmp", "-j $accept_action"); # important for multicast
2441
2442     # add host rules first, so that cluster wide rules can be overwritten
2443     foreach my $rule (@$rules, @$cluster_rules) {
2444         next if !$rule->{enable} || $rule->{errors};
2445         next if $rule->{ipversion} && ($rule->{ipversion} != $ipversion);
2446
2447         $rule->{iface_in} = $rule->{iface} if $rule->{iface};
2448
2449         eval {
2450             if ($rule->{type} eq 'group') {
2451                 ruleset_add_group_rule($ruleset, $cluster_conf, $chain, $rule, 'IN', $accept_action, $ipversion);
2452             } elsif ($rule->{type} eq 'in') {
2453                 rule_substitude_action($rule, { ACCEPT => $accept_action, REJECT => "PVEFW-reject" });
2454                 ruleset_generate_rule($ruleset, $chain, $ipversion, $rule, $cluster_conf, $hostfw_conf, 0);
2455             }
2456         };
2457         warn $@ if $@;
2458         delete $rule->{iface_in};
2459     }
2460
2461     # allow standard traffic for management ipset (includes cluster network)
2462     my $mngmnt_ipset_chain = compute_ipset_chain_name(0, "management", $ipversion);
2463     my $mngmntsrc = "-m set --match-set ${mngmnt_ipset_chain} src";
2464     ruleset_addrule($ruleset, $chain, "$mngmntsrc -p tcp --dport 8006", "-j $accept_action");  # PVE API
2465     ruleset_addrule($ruleset, $chain, "$mngmntsrc -p tcp --dport 5900:5999", "-j $accept_action");  # PVE VNC Console
2466     ruleset_addrule($ruleset, $chain, "$mngmntsrc -p tcp --dport 3128", "-j $accept_action");  # SPICE Proxy
2467     ruleset_addrule($ruleset, $chain, "$mngmntsrc -p tcp --dport 22", "-j $accept_action");  # SSH
2468
2469     # corosync inbound rules
2470     if (defined($corosync_conf)) {
2471         ruleset_addrule($ruleset, $chain, "-m addrtype --dst-type MULTICAST $corosync_rule", "-j $accept_action")
2472             if $multicast_enabled;
2473
2474         PVE::Corosync::for_all_corosync_addresses($corosync_conf, $ipversion, sub {
2475             my ($node_name, $node_ip, $node_ipversion, $key) = @_;
2476
2477             if ($node_name ne $local_hostname) {
2478                 my $destination = $corosync_local_addresses->{$key};
2479
2480                 # accept only traffic on same ring
2481                 if (defined($destination)) {
2482                     ruleset_addrule($ruleset, $chain, "-d $destination -s $node_ip $corosync_rule", "-j $accept_action");
2483                 }
2484             }
2485         });
2486     }
2487
2488     # implement input policy
2489     my $policy = $cluster_options->{policy_in} || 'DROP'; # allow nothing by default
2490     ruleset_add_chain_policy($ruleset, $chain, $ipversion, 0, $policy, $loglevel, $accept_action);
2491
2492     # host outbound firewall
2493     $chain = "PVEFW-HOST-OUT";
2494     ruleset_create_chain($ruleset, $chain);
2495
2496     $loglevel = get_option_log_level($options, "log_level_out");
2497
2498     ruleset_addrule($ruleset, $chain, "-o lo", "-j ACCEPT");
2499
2500     ruleset_chain_add_conn_filters($ruleset, $chain, 0, 'ACCEPT');
2501
2502     # we use RETURN because we may want to check other thigs later
2503     $accept_action = 'RETURN';
2504     ruleset_chain_add_ndp($ruleset, $chain, $ipversion, $options, 'OUT', "-j $accept_action");
2505
2506     ruleset_addrule($ruleset, $chain, "-p igmp", "-j $accept_action"); # important for multicast
2507
2508     # add host rules first, so that cluster wide rules can be overwritten
2509     foreach my $rule (@$rules, @$cluster_rules) {
2510         next if !$rule->{enable} || $rule->{errors};
2511         next if $rule->{ipversion} && ($rule->{ipversion} != $ipversion);
2512
2513         $rule->{iface_out} = $rule->{iface} if $rule->{iface};
2514         eval {
2515             $rule->{logmsg} = "$rule->{action}: ";
2516             if ($rule->{type} eq 'group') {
2517                 ruleset_add_group_rule($ruleset, $cluster_conf, $chain, $rule, 'OUT', $accept_action, $ipversion);
2518             } elsif ($rule->{type} eq 'out') {
2519                 rule_substitude_action($rule, { ACCEPT => $accept_action, REJECT => "PVEFW-reject" });
2520                 ruleset_generate_rule($ruleset, $chain, $ipversion, $rule, $cluster_conf, $hostfw_conf, 0);
2521             }
2522         };
2523         warn $@ if $@;
2524         delete $rule->{iface_out};
2525     }
2526
2527     # allow standard traffic on cluster network
2528     my $localnet = $cluster_conf->{aliases}->{local_network}->{cidr};
2529     my $localnet_ver = $cluster_conf->{aliases}->{local_network}->{ipversion};
2530
2531     if ($localnet && ($ipversion == $localnet_ver)) {
2532         ruleset_addrule($ruleset, $chain, "-d $localnet -p tcp --dport 8006", "-j $accept_action");  # PVE API
2533         ruleset_addrule($ruleset, $chain, "-d $localnet -p tcp --dport 22", "-j $accept_action");  # SSH
2534         ruleset_addrule($ruleset, $chain, "-d $localnet -p tcp --dport 5900:5999", "-j $accept_action");  # PVE VNC Console
2535         ruleset_addrule($ruleset, $chain, "-d $localnet -p tcp --dport 3128", "-j $accept_action");  # SPICE Proxy
2536     }
2537
2538     # corosync outbound rules
2539     if (defined($corosync_conf)) {
2540         ruleset_addrule($ruleset, $chain, "-m addrtype --dst-type MULTICAST $corosync_rule", "-j $accept_action")
2541             if $multicast_enabled;
2542
2543         PVE::Corosync::for_all_corosync_addresses($corosync_conf, $ipversion, sub {
2544             my ($node_name, $node_ip, $node_ipversion, $key) = @_;
2545
2546             if ($node_name ne $local_hostname) {
2547                 my $source = $corosync_local_addresses->{$key};
2548
2549                 # accept only traffic on same ring
2550                 if (defined($source)) {
2551                     ruleset_addrule($ruleset, $chain, "-s $source -d $node_ip $corosync_rule", "-j $accept_action");
2552                 }
2553             }
2554         });
2555     }
2556
2557     # implement output policy
2558     $policy = $cluster_options->{policy_out} || 'ACCEPT'; # allow everything by default
2559     ruleset_add_chain_policy($ruleset, $chain, $ipversion, 0, $policy, $loglevel, $accept_action);
2560
2561     ruleset_addrule($ruleset, "PVEFW-OUTPUT", "", "-j PVEFW-HOST-OUT");
2562     ruleset_addrule($ruleset, "PVEFW-INPUT", "", "-j PVEFW-HOST-IN");
2563 }
2564
2565 sub generate_group_rules {
2566     my ($ruleset, $cluster_conf, $group, $ipversion) = @_;
2567
2568     my $rules = $cluster_conf->{groups}->{$group};
2569
2570     if (!$rules) {
2571         warn "no such security group '$group'\n";
2572         $rules = []; # create empty chain
2573     }
2574
2575     my $chain = "GROUP-${group}-IN";
2576
2577     ruleset_create_chain($ruleset, $chain);
2578     ruleset_addrule($ruleset, $chain, "", "-j MARK --set-mark $FWACCEPTMARK_OFF"); # clear mark
2579
2580     foreach my $rule (@$rules) {
2581         next if $rule->{type} ne 'in';
2582         next if !$rule->{enable} || $rule->{errors};
2583         next if $rule->{ipversion} && $rule->{ipversion} ne $ipversion;
2584         rule_substitude_action($rule, { ACCEPT => "PVEFW-SET-ACCEPT-MARK", REJECT => "PVEFW-reject" });
2585         ruleset_generate_rule($ruleset, $chain, $ipversion, $rule, $cluster_conf);
2586     }
2587
2588     $chain = "GROUP-${group}-OUT";
2589
2590     ruleset_create_chain($ruleset, $chain);
2591     ruleset_addrule($ruleset, $chain, "", "-j MARK --set-mark $FWACCEPTMARK_OFF"); # clear mark
2592
2593     foreach my $rule (@$rules) {
2594         next if $rule->{type} ne 'out';
2595         next if !$rule->{enable} || $rule->{errors};
2596         next if $rule->{ipversion} && $rule->{ipversion} ne $ipversion;
2597         # we use PVEFW-SET-ACCEPT-MARK (Instead of ACCEPT) because we need to
2598         # check also other tap rules later
2599         rule_substitude_action($rule, { ACCEPT => 'PVEFW-SET-ACCEPT-MARK', REJECT => "PVEFW-reject" });
2600         ruleset_generate_rule($ruleset, $chain, $ipversion, $rule, $cluster_conf);
2601     }
2602 }
2603
2604 my $MAX_NETS = 32;
2605 my $valid_netdev_names = {};
2606 for (my $i = 0; $i < $MAX_NETS; $i++)  {
2607     $valid_netdev_names->{"net$i"} = 1;
2608 }
2609
2610 sub get_mark_values {
2611     my ($value, $mask) = @_;
2612     $value = hex($value) if $value =~ /^0x/;
2613     $mask = hex($mask) if defined($mask) && $mask =~ /^0x/;
2614     $mask = 0xffffffff if !defined($mask);
2615     return ($value, $mask);
2616 }
2617
2618 sub parse_fw_rule {
2619     my ($prefix, $line, $cluster_conf, $fw_conf, $rule_env) = @_;
2620
2621     my $orig_line = $line;
2622
2623     my $rule = {};
2624
2625     # we can add single line comments to the end of the rule
2626     if ($line =~ s/#\s*(.*?)\s*$//) {
2627         $rule->{comment} = decode('utf8', $1);
2628     }
2629
2630     # we can disable a rule when prefixed with '|'
2631
2632     $rule->{enable} = $line =~ s/^\|// ? 0 : 1;
2633
2634     $line =~ s/^(\S+)\s+(\S+)\s*// ||
2635         die "unable to parse rule: $line\n";
2636
2637     $rule->{type} = lc($1);
2638     $rule->{action} = $2;
2639
2640     if ($rule->{type} eq  'in' || $rule->{type} eq 'out') {
2641         if ($rule->{action} =~ m/^(\S+)\((ACCEPT|DROP|REJECT)\)$/) {
2642             $rule->{macro} = $1;
2643             $rule->{action} = $2;
2644         }
2645     }
2646
2647     while (length($line)) {
2648         if ($line =~ s/^-i (\S+)\s*//) {
2649             $rule->{iface} = $1;
2650             next;
2651         }
2652
2653         last if $rule->{type} eq 'group';
2654
2655         if ($line =~ s/^-p (\S+)\s*//) {
2656             $rule->{proto} = $1;
2657             next;
2658         }
2659
2660         if ($line =~ s/^-dport (\S+)\s*//) {
2661             $rule->{dport} = $1;
2662             next;
2663         }
2664
2665         if ($line =~ s/^-sport (\S+)\s*//) {
2666             $rule->{sport} = $1;
2667             next;
2668         }
2669         if ($line =~ s/^-source (\S+)\s*//) {
2670             $rule->{source} = $1;
2671             next;
2672         }
2673         if ($line =~ s/^-dest (\S+)\s*//) {
2674             $rule->{dest} = $1;
2675             next;
2676         }
2677         if ($line =~ s/^-log (emerg|alert|crit|err|warning|notice|info|debug|nolog)\s*//) {
2678             $rule->{log} = $1;
2679             next;
2680         }
2681
2682         last;
2683     }
2684
2685     die "unable to parse rule parameters: $line\n" if length($line);
2686
2687     $rule = verify_rule($rule, $cluster_conf, $fw_conf, $rule_env, 1);
2688     if ($rule->{errors}) {
2689         # The verbose flag really means we're running from the CLI and want
2690         # output on the console - in the other case we really want such errors
2691         # to go into the syslog instead.
2692         my $log = $verbose ? sub { warn @_ } : sub { syslog(err => @_) };
2693         $log->("$prefix - errors in rule parameters: $orig_line\n");
2694         foreach my $p (keys %{$rule->{errors}}) {
2695             $log->("  $p: $rule->{errors}->{$p}\n");
2696         }
2697     }
2698
2699     return $rule;
2700 }
2701
2702 sub verify_ethertype {
2703     my ($value) = @_;
2704     my $types = get_etc_ethertypes();
2705     die "unknown ethernet protocol type: $value\n"
2706         if !defined($types->{byname}->{$value}) &&
2707            !defined($types->{byid}->{$value});
2708 }
2709
2710 sub parse_vmfw_option {
2711     my ($line) = @_;
2712
2713     my ($opt, $value);
2714
2715     my $loglevels = "emerg|alert|crit|err|warning|notice|info|debug|nolog";
2716
2717     if ($line =~ m/^(enable|dhcp|ndp|radv|macfilter|ipfilter|ips):\s*(0|1)\s*$/i) {
2718         $opt = lc($1);
2719         $value = int($2);
2720     } elsif ($line =~ m/^(log_level_in|log_level_out):\s*(($loglevels)\s*)?$/i) {
2721         $opt = lc($1);
2722         $value = $2 ? lc($3) : '';
2723     } elsif ($line =~ m/^(policy_(in|out)):\s*(ACCEPT|DROP|REJECT)\s*$/i) {
2724         $opt = lc($1);
2725         $value = uc($3);
2726     } elsif ($line =~ m/^(ips_queues):\s*((\d+)(:(\d+))?)\s*$/i) {
2727         $opt = lc($1);
2728         $value = $2;
2729     } elsif ($line =~ m/^(layer2_protocols):\s*(((\S+)[,]?)+)\s*$/i) {
2730         $opt = lc($1);
2731         $value = $2;
2732         verify_ethertype($_) foreach split(/\s*,\s*/, $value);
2733     } else {
2734         die "can't parse option '$line'\n"
2735     }
2736
2737     return ($opt, $value);
2738 }
2739
2740 sub parse_hostfw_option {
2741     my ($line) = @_;
2742
2743     my ($opt, $value);
2744
2745     my $loglevels = "emerg|alert|crit|err|warning|notice|info|debug|nolog";
2746
2747     if ($line =~ m/^(enable|nosmurfs|tcpflags|ndp|log_nf_conntrack|nf_conntrack_allow_invalid):\s*(0|1)\s*$/i) {
2748         $opt = lc($1);
2749         $value = int($2);
2750     } elsif ($line =~ m/^(log_level_in|log_level_out|tcp_flags_log_level|smurf_log_level):\s*(($loglevels)\s*)?$/i) {
2751         $opt = lc($1);
2752         $value = $2 ? lc($3) : '';
2753     } elsif ($line =~ m/^(nf_conntrack_max|nf_conntrack_tcp_timeout_established):\s*(\d+)\s*$/i) {
2754         $opt = lc($1);
2755         $value = int($2);
2756     } else {
2757         die "can't parse option '$line'\n"
2758     }
2759
2760     return ($opt, $value);
2761 }
2762
2763 sub parse_clusterfw_option {
2764     my ($line) = @_;
2765
2766     my ($opt, $value);
2767
2768     if ($line =~ m/^(enable):\s*(\d+)\s*$/i) {
2769         $opt = lc($1);
2770         $value = int($2);
2771         if (($value > 1) && ((time() - $value) > 60)) {
2772             $value = 0
2773         }
2774     } elsif ($line =~ m/^(ebtables):\s*(0|1)\s*$/i) {
2775         $opt = lc($1);
2776         $value = int($2);
2777     } elsif ($line =~ m/^(policy_(in|out)):\s*(ACCEPT|DROP|REJECT)\s*$/i) {
2778         $opt = lc($1);
2779         $value = uc($3);
2780     } elsif ($line =~ m/^(log_ratelimit):\s*(\S+)\s*$/) {
2781         $opt = lc($1);
2782         $value = $2;
2783     } else {
2784         die "can't parse option '$line'\n"
2785     }
2786
2787     return ($opt, $value);
2788 }
2789
2790 sub resolve_alias {
2791     my ($clusterfw_conf, $fw_conf, $cidr) = @_;
2792
2793     my $alias = lc($cidr);
2794     my $e = $fw_conf ? $fw_conf->{aliases}->{$alias} : undef;
2795     $e = $clusterfw_conf->{aliases}->{$alias} if !$e && $clusterfw_conf;
2796
2797     die "no such alias '$cidr'\n" if !$e;;
2798
2799     return wantarray ? ($e->{cidr}, $e->{ipversion}) : $e->{cidr};
2800 }
2801
2802 sub parse_ip_or_cidr {
2803     my ($cidr) = @_;
2804
2805     my $ipversion;
2806     
2807     if ($cidr =~ m!^(?:$IPV6RE)(/(\d+))?$!) {
2808         $cidr =~ s|/128$||;
2809         $ipversion = 6;
2810     } elsif ($cidr =~ m!^(?:$IPV4RE)(/(\d+))?$!) {
2811         $cidr =~ s|/32$||;
2812         $ipversion = 4;
2813     } else {
2814         die "value does not look like a valid IP address or CIDR network\n";
2815     }
2816
2817     return wantarray ? ($cidr, $ipversion) : $cidr;
2818 }
2819
2820 sub parse_alias {
2821     my ($line) = @_;
2822
2823     # we can add single line comments to the end of the line
2824     my $comment = decode('utf8', $1) if $line =~ s/\s*#\s*(.*?)\s*$//;
2825
2826     if ($line =~ m/^(\S+)\s(\S+)$/) {
2827         my ($name, $cidr) = ($1, $2);
2828         my $ipversion;
2829
2830         ($cidr, $ipversion) = parse_ip_or_cidr($cidr);
2831
2832         my $data = {
2833             name => $name,
2834             cidr => $cidr,
2835             ipversion => $ipversion,
2836         };
2837         $data->{comment} = $comment  if $comment;
2838         return $data;
2839     }
2840
2841     return undef;
2842 }
2843
2844 sub generic_fw_config_parser {
2845     my ($filename, $cluster_conf, $empty_conf, $rule_env) = @_;
2846
2847     my $section;
2848     my $group;
2849
2850     my $res = $empty_conf;
2851
2852     my $raw;
2853     if ($filename =~ m!^/etc/pve/(.*)$!) {
2854         $raw = PVE::Cluster::get_config($1);
2855     } else {
2856         $raw = eval { PVE::Tools::file_get_contents($filename) }; # ignore errors
2857     }
2858     return {} if !$raw;
2859
2860     my $linenr = 0;
2861     while ($raw =~ /^\h*(.*?)\h*$/gm) {
2862         my $line = $1;
2863         $linenr++;
2864         next if $line =~ m/^#/;
2865         next if $line =~ m/^\s*$/;
2866         chomp $line;
2867
2868         my $prefix = "$filename (line $linenr)";
2869
2870         if ($empty_conf->{options} && ($line =~ m/^\[options\]$/i)) {
2871             $section = 'options';
2872             next;
2873         }
2874
2875         if ($empty_conf->{aliases} && ($line =~ m/^\[aliases\]$/i)) {
2876             $section = 'aliases';
2877             next;
2878         }
2879
2880         if ($empty_conf->{groups} && ($line =~ m/^\[group\s+(\S+)\]\s*(?:#\s*(.*?)\s*)?$/i)) {
2881             $section = 'groups';
2882             $group = lc($1);
2883             my $comment = $2;
2884             eval {
2885                 die "security group name too long\n" if length($group) > $max_group_name_length;
2886                 die "invalid security group name '$group'\n" if $group !~ m/^${security_group_name_pattern}$/;
2887             };
2888             if (my $err = $@) {
2889                 ($section, $group, $comment) = undef;
2890                 warn "$prefix: $err";
2891                 next;
2892             }
2893             
2894             $res->{$section}->{$group} = [];
2895             $res->{group_comments}->{$group} =  decode('utf8', $comment)
2896                 if $comment;
2897             next;
2898         }
2899
2900         if ($empty_conf->{rules} && ($line =~ m/^\[rules\]$/i)) {
2901             $section = 'rules';
2902             next;
2903         }
2904
2905         if ($empty_conf->{ipset} && ($line =~ m/^\[ipset\s+(\S+)\]\s*(?:#\s*(.*?)\s*)?$/i)) {
2906             $section = 'ipset';
2907             $group = lc($1);
2908             my $comment = $2;
2909             eval {      
2910                 die "ipset name too long\n" if length($group) > $max_ipset_name_length;
2911                 die "invalid ipset name '$group'\n" if $group !~ m/^${ipset_name_pattern}$/;
2912             };
2913             if (my $err = $@) {
2914                 ($section, $group, $comment) = undef;
2915                 warn "$prefix: $err";
2916                 next;
2917             }
2918
2919             $res->{$section}->{$group} = [];
2920             $res->{ipset_comments}->{$group} = decode('utf8', $comment)
2921                 if $comment;
2922             next;
2923         }
2924
2925         if (!$section) {
2926             warn "$prefix: skip line - no section\n";
2927             next;
2928         }
2929
2930         if ($section eq 'options') {
2931             eval {
2932                 my ($opt, $value);
2933                 if ($rule_env eq 'cluster') {
2934                     ($opt, $value) = parse_clusterfw_option($line);
2935                 } elsif ($rule_env eq 'host') {
2936                     ($opt, $value) = parse_hostfw_option($line);
2937                 } else {
2938                     ($opt, $value) = parse_vmfw_option($line);
2939                 }
2940                 $res->{options}->{$opt} = $value;
2941             };
2942             warn "$prefix: $@" if $@;
2943         } elsif ($section eq 'aliases') {
2944             eval {
2945                 my $data = parse_alias($line);
2946                 $res->{aliases}->{lc($data->{name})} = $data;
2947             };
2948             warn "$prefix: $@" if $@;
2949         } elsif ($section eq 'rules') {
2950             my $rule;
2951             eval { $rule = parse_fw_rule($prefix, $line, $cluster_conf, $res, $rule_env); };
2952             if (my $err = $@) {
2953                 warn "$prefix: $err";
2954                 next;
2955             }
2956             push @{$res->{$section}}, $rule;
2957         } elsif ($section eq 'groups') {
2958             my $rule;
2959             eval { $rule = parse_fw_rule($prefix, $line, $cluster_conf, undef, 'group'); };
2960             if (my $err = $@) {
2961                 warn "$prefix: $err";
2962                 next;
2963             }
2964             push @{$res->{$section}->{$group}}, $rule;
2965         } elsif ($section eq 'ipset') {
2966             # we can add single line comments to the end of the rule
2967             my $comment = decode('utf8', $1) if $line =~ s/#\s*(.*?)\s*$//;
2968
2969             $line =~ m/^(\!)?\s*(\S+)\s*$/;
2970             my $nomatch = $1;
2971             my $cidr = $2;
2972             my $errors;
2973
2974             if ($nomatch && !$feature_ipset_nomatch) {
2975                 $errors->{nomatch} = "nomatch not supported by kernel";
2976             }
2977
2978             eval { 
2979                 if ($cidr =~ m/^${ip_alias_pattern}$/) {
2980                     resolve_alias($cluster_conf, $res, $cidr); # make sure alias exists
2981                 } else {
2982                     $cidr = parse_ip_or_cidr($cidr);
2983                 }
2984             };
2985             if (my $err = $@) {
2986                 chomp $err;
2987                 $errors->{cidr} = $err;
2988             }
2989
2990             if ($cidr =~ m!/0+$!) {
2991                 $errors->{cidr} = "a zero prefix is not allowed in ipset entries\n";
2992             }
2993
2994             my $entry = { cidr => $cidr };
2995             $entry->{nomatch} = 1 if $nomatch;
2996             $entry->{comment} = $comment if $comment;
2997             $entry->{errors} =  $errors if $errors;
2998
2999             if ($verbose && $errors) {
3000                 warn "$prefix - errors in ipset '$group': $line\n";
3001                 foreach my $p (keys %{$errors}) {
3002                     warn "  $p: $errors->{$p}\n";
3003                 }
3004             }
3005
3006             push @{$res->{$section}->{$group}}, $entry;
3007         } else {
3008             warn "$prefix: skip line - unknown section\n";
3009             next;
3010         }
3011     }
3012
3013     return $res;
3014 }
3015
3016 sub run_locked {
3017     my ($code, @param) = @_;
3018
3019     my $timeout = 10;
3020
3021     my $res = lock_file($pve_fw_lock_filename, $timeout, $code, @param);
3022
3023     die $@ if $@;
3024
3025     return $res;
3026 }
3027
3028 sub read_local_vm_config {
3029
3030     my $qemu = {};
3031     my $lxc = {};
3032
3033     my $vmdata = { qemu => $qemu, lxc => $lxc };
3034
3035     my $vmlist = PVE::Cluster::get_vmlist();
3036     return $vmdata if !$vmlist || !$vmlist->{ids};
3037     my $ids = $vmlist->{ids};
3038
3039     foreach my $vmid (keys %$ids) {
3040         next if !$vmid; # skip VE0
3041         my $d = $ids->{$vmid};
3042         next if !$d->{node} || $d->{node} ne $nodename;
3043         next if !$d->{type};
3044         if ($d->{type} eq 'qemu') {
3045             if ($have_qemu_server) {
3046                 my $cfspath = PVE::QemuConfig->cfs_config_path($vmid);
3047                 if (my $conf = PVE::Cluster::cfs_read_file($cfspath)) {
3048                     $qemu->{$vmid} = $conf;
3049                 }
3050             }
3051         } elsif ($d->{type} eq 'lxc') {
3052             if ($have_lxc) {
3053                 my $cfspath = PVE::LXC::Config->cfs_config_path($vmid);
3054                 if (my $conf = PVE::Cluster::cfs_read_file($cfspath)) {
3055                     $lxc->{$vmid} = $conf;
3056                 }
3057             }
3058         }
3059     }
3060
3061     return $vmdata;
3062 };
3063
3064 sub load_vmfw_conf {
3065     my ($cluster_conf, $rule_env, $vmid, $dir) = @_;
3066
3067     $dir = $pvefw_conf_dir if !defined($dir);
3068     my $filename = "$dir/$vmid.fw";
3069
3070     my $empty_conf = {
3071         rules => [],
3072         options => {},
3073         aliases => {},
3074         ipset => {} ,
3075         ipset_comments => {},
3076     };
3077
3078     my $vmfw_conf = generic_fw_config_parser($filename, $cluster_conf, $empty_conf, $rule_env);
3079     $vmfw_conf->{vmid} = $vmid;
3080
3081     return $vmfw_conf;
3082 }
3083
3084 my $format_rules = sub {
3085     my ($rules, $allow_iface) = @_;
3086
3087     my $raw = '';
3088
3089     foreach my $rule (@$rules) {
3090         if ($rule->{type} eq  'in' || $rule->{type} eq 'out' || $rule->{type} eq 'group') {
3091             $raw .= '|' if defined($rule->{enable}) && !$rule->{enable};
3092             $raw .= uc($rule->{type});
3093             if ($rule->{macro}) {
3094                 $raw .= " $rule->{macro}($rule->{action})";
3095             } else {
3096                 $raw .= " " . $rule->{action};
3097             }
3098             if ($allow_iface && $rule->{iface}) {
3099                 $raw .= " -i $rule->{iface}";
3100             }
3101
3102             if ($rule->{type} ne  'group')  {
3103                 $raw .= " -source $rule->{source}" if $rule->{source};
3104                 $raw .= " -dest $rule->{dest}" if $rule->{dest};
3105                 $raw .= " -p $rule->{proto}" if $rule->{proto};
3106                 $raw .= " -dport $rule->{dport}" if $rule->{dport};
3107                 $raw .= " -sport $rule->{sport}" if $rule->{sport};
3108                 $raw .= " -log $rule->{log}" if $rule->{log};
3109             }
3110
3111             $raw .= " # " . encode('utf8', $rule->{comment})
3112                 if $rule->{comment} && $rule->{comment} !~ m/^\s*$/;
3113             $raw .= "\n";
3114         } else {
3115             die "unknown rule type '$rule->{type}'";
3116         }
3117     }
3118
3119     return $raw;
3120 };
3121
3122 my $format_options = sub {
3123     my ($options) = @_;
3124
3125     my $raw = '';
3126
3127     $raw .= "[OPTIONS]\n\n";
3128     foreach my $opt (keys %$options) {
3129         $raw .= "$opt: $options->{$opt}\n";
3130     }
3131     $raw .= "\n";
3132
3133     return $raw;
3134 };
3135
3136 my $format_aliases = sub {
3137     my ($aliases) = @_;
3138
3139     my $raw = '';
3140
3141     $raw .= "[ALIASES]\n\n";
3142     foreach my $k (keys %$aliases) {
3143         my $e = $aliases->{$k};
3144         $raw .= "$e->{name} $e->{cidr}";
3145         $raw .= " # " . encode('utf8', $e->{comment})
3146             if $e->{comment} && $e->{comment} !~ m/^\s*$/;
3147         $raw .= "\n";
3148     }
3149     $raw .= "\n";
3150
3151     return $raw;
3152 };
3153
3154 my $format_ipsets = sub {
3155     my ($fw_conf) = @_;
3156     
3157     my $raw = '';
3158
3159     foreach my $ipset (sort keys %{$fw_conf->{ipset}}) {
3160         if (my $comment = $fw_conf->{ipset_comments}->{$ipset}) {
3161             my $utf8comment = encode('utf8', $comment);
3162             $raw .= "[IPSET $ipset] # $utf8comment\n\n";
3163         } else {
3164             $raw .= "[IPSET $ipset]\n\n";
3165         }
3166         my $options = $fw_conf->{ipset}->{$ipset};
3167
3168         my $nethash = {};
3169         foreach my $entry (@$options) {
3170             $nethash->{$entry->{cidr}} = $entry;
3171         }
3172
3173         foreach my $cidr (sort keys %$nethash) {
3174             my $entry = $nethash->{$cidr};
3175             my $line = $entry->{nomatch} ? '!' : '';
3176             $line .= $entry->{cidr};
3177             $line .= " # " . encode('utf8', $entry->{comment})
3178                 if $entry->{comment} && $entry->{comment} !~ m/^\s*$/;
3179             $raw .= "$line\n";
3180         }
3181
3182         $raw .= "\n";
3183     }
3184
3185     return $raw;
3186 };
3187
3188 sub save_vmfw_conf {
3189     my ($vmid, $vmfw_conf) = @_;
3190
3191     my $raw = '';
3192
3193     my $options = $vmfw_conf->{options};
3194     $raw .= &$format_options($options) if $options && scalar(keys %$options);
3195
3196     my $aliases = $vmfw_conf->{aliases};
3197     $raw .= &$format_aliases($aliases) if $aliases && scalar(keys %$aliases);
3198
3199     $raw .= &$format_ipsets($vmfw_conf) if $vmfw_conf->{ipset};
3200
3201     my $rules = $vmfw_conf->{rules} || [];
3202     if ($rules && scalar(@$rules)) {
3203         $raw .= "[RULES]\n\n";
3204         $raw .= &$format_rules($rules, 1);
3205         $raw .= "\n";
3206     }
3207
3208     my $filename = "$pvefw_conf_dir/$vmid.fw";
3209     if ($raw) {
3210         mkdir $pvefw_conf_dir;
3211         PVE::Tools::file_set_contents($filename, $raw);
3212     } else {
3213         unlink $filename;
3214     }
3215 }
3216
3217 sub remove_vmfw_conf {
3218     my ($vmid) = @_;
3219
3220     my $vmfw_conffile = "$pvefw_conf_dir/$vmid.fw";
3221
3222     unlink $vmfw_conffile;
3223 }
3224
3225 sub clone_vmfw_conf {
3226     my ($vmid, $newid) = @_;
3227
3228     my $sourcevm_conffile = "$pvefw_conf_dir/$vmid.fw";
3229     my $clonevm_conffile = "$pvefw_conf_dir/$newid.fw";
3230
3231     if (-f $clonevm_conffile) {
3232         unlink $clonevm_conffile;
3233     }
3234     if (-f $sourcevm_conffile) {
3235         my $data = PVE::Tools::file_get_contents($sourcevm_conffile);
3236         PVE::Tools::file_set_contents($clonevm_conffile, $data);
3237     }
3238 }
3239
3240 sub read_vm_firewall_configs {
3241     my ($cluster_conf, $vmdata, $dir) = @_;
3242
3243     my $vmfw_configs = {};
3244
3245     foreach my $vmid (keys %{$vmdata->{qemu}}) {
3246         my $vmfw_conf = load_vmfw_conf($cluster_conf, 'vm', $vmid, $dir);
3247         next if !$vmfw_conf->{options}; # skip if file does not exists
3248         $vmfw_configs->{$vmid} = $vmfw_conf;
3249     }
3250     foreach my $vmid (keys %{$vmdata->{lxc}}) {
3251         my $vmfw_conf = load_vmfw_conf($cluster_conf, 'ct', $vmid, $dir);
3252         next if !$vmfw_conf->{options}; # skip if file does not exists
3253         $vmfw_configs->{$vmid} = $vmfw_conf;
3254     }
3255
3256     return $vmfw_configs;
3257 }
3258
3259 sub get_option_log_level {
3260     my ($options, $k) = @_;
3261
3262     my $v = $options->{$k};
3263     $v = $default_log_level if !defined($v);
3264
3265     return undef if $v eq '' || $v eq 'nolog';
3266
3267     return $v if defined($log_level_hash->{$v});
3268
3269     warn "unknown log level ($k = '$v')\n";
3270
3271     return undef;
3272 }
3273
3274 sub generate_std_chains {
3275     my ($ruleset, $options, $ipversion) = @_;
3276
3277     my $std_chains = $pve_std_chains->{$ipversion} || die "internal error";
3278
3279     my $loglevel = get_option_log_level($options, 'smurf_log_level');
3280     my $chain = 'PVEFW-smurflog';
3281     if ( $std_chains->{$chain} ) {
3282         foreach my $r (@{$std_chains->{$chain}}) {
3283           $r->{log} = $loglevel;
3284         }
3285     }
3286
3287     # same as shorewall logflags action.
3288     $loglevel = get_option_log_level($options, 'tcp_flags_log_level');
3289     $chain = 'PVEFW-logflags';
3290     if ( $std_chains->{$chain} ) {
3291         foreach my $r (@{$std_chains->{$chain}}) {
3292           $r->{log} = $loglevel;
3293         }
3294     }
3295
3296     foreach my $chain (keys %$std_chains) {
3297         ruleset_create_chain($ruleset, $chain);
3298         foreach my $rule (@{$std_chains->{$chain}}) {
3299             if (ref($rule)) {
3300                 ruleset_generate_rule($ruleset, $chain, $ipversion, $rule, 0);
3301             } else {
3302                 die "rule $rule as string - should not happen";
3303             }
3304         }
3305     }
3306 }
3307
3308 sub generate_ipset_chains {
3309     my ($ipset_ruleset, $clusterfw_conf, $fw_conf, $device_ips, $ipsets) = @_;
3310
3311     foreach my $ipset (keys %{$ipsets}) {
3312
3313         my $options = $ipsets->{$ipset};
3314
3315         if ($device_ips && $ipset =~ /^ipfilter-(net\d+)$/) {
3316             if (my $ips = $device_ips->{$1}) {
3317                 $options = [@$options, @$ips];
3318             }
3319         }
3320
3321         # remove duplicates
3322         my $nethash = {};
3323         foreach my $entry (@$options) {
3324             next if $entry->{errors}; # skip entries with errors
3325             eval {
3326                 my ($cidr, $ver);
3327                 if ($entry->{cidr} =~ m/^${ip_alias_pattern}$/) {
3328                     ($cidr, $ver) = resolve_alias($clusterfw_conf, $fw_conf, $entry->{cidr});
3329                 } else {
3330                     ($cidr, $ver) = parse_ip_or_cidr($entry->{cidr});
3331                 }
3332                 #http://backreference.org/2013/03/01/ipv6-address-normalization/
3333                 if ($ver == 6) {
3334                     # ip_compress_address takes an address only, no CIDR
3335                     my ($addr, $prefix_len) = ($cidr =~ m@^([^/]*)(/.*)?$@);
3336                     $cidr = lc(Net::IP::ip_compress_address($addr, 6));
3337                     $cidr .= $prefix_len if defined($prefix_len);
3338                     $cidr =~ s|/128$||;
3339                 } else {
3340                     $cidr =~ s|/32$||;
3341                 }
3342
3343                 $nethash->{$ver}->{$cidr} = { cidr => $cidr, nomatch => $entry->{nomatch} };
3344             };
3345             warn $@ if $@;
3346         }
3347
3348         foreach my $ipversion (4, 6) {
3349             my $data = $nethash->{$ipversion};
3350
3351             my $name = compute_ipset_chain_name($fw_conf->{vmid}, $ipset, $ipversion);
3352
3353             my $hashsize = scalar(@$options);
3354             if ($hashsize <= 64) {
3355                 $hashsize = 64;
3356             } else {
3357                 $hashsize = round_powerof2($hashsize);
3358             }
3359
3360             my $family = $ipversion == "6" ? "inet6" : "inet";
3361
3362             $ipset_ruleset->{$name} = ["create $name hash:net family $family hashsize $hashsize maxelem $hashsize"];
3363
3364             foreach my $cidr (sort keys %$data) {
3365                 my $entry = $data->{$cidr};
3366
3367                 my $cmd = "add $name $cidr";
3368                 if ($entry->{nomatch}) {
3369                     if ($feature_ipset_nomatch) {
3370                         push @{$ipset_ruleset->{$name}}, "$cmd nomatch";
3371                     } else {
3372                         warn "ignore !$cidr - nomatch not supported by kernel\n";
3373                     }
3374                 } else {
3375                     push @{$ipset_ruleset->{$name}}, $cmd;
3376                 }
3377             }
3378         }
3379     }
3380 }
3381
3382 sub round_powerof2 {
3383     my ($int) = @_;
3384
3385     $int--;
3386     $int |= $int >> $_ foreach (1,2,4,8,16);
3387     return ++$int;
3388 }
3389
3390 my $set_global_log_ratelimit = sub {
3391     my $cluster_opts = shift;
3392
3393     $global_log_ratelimit = '--limit 1/sec';
3394     if (defined(my $log_rlimit = $cluster_opts->{log_ratelimit})) {
3395         my $ll_format = $cluster_option_properties->{log_ratelimit}->{format};
3396         my $limit = PVE::JSONSchema::parse_property_string($ll_format, $log_rlimit);
3397
3398         if ($limit->{enable}) {
3399             if (my $rate = $limit->{rate}) {
3400                 $global_log_ratelimit = "--limit $rate";
3401             }
3402             if (my $burst = $limit->{burst}) {
3403                 $global_log_ratelimit .= " --limit-burst $burst";
3404             }
3405         } else {
3406             $global_log_ratelimit = undef;
3407         }
3408     }
3409 };
3410
3411 sub load_clusterfw_conf {
3412     my ($filename) = @_;
3413
3414     $filename = $clusterfw_conf_filename if !defined($filename);
3415     my $empty_conf = {
3416         rules => [],
3417         options => {},
3418         aliases => {},
3419         groups => {},
3420         group_comments => {},
3421         ipset => {} ,
3422         ipset_comments => {},
3423     };
3424
3425     my $cluster_conf = generic_fw_config_parser($filename, $empty_conf, $empty_conf, 'cluster');
3426     $set_global_log_ratelimit->($cluster_conf->{options});
3427
3428     return $cluster_conf;
3429 }
3430
3431 sub save_clusterfw_conf {
3432     my ($cluster_conf) = @_;
3433
3434     my $raw = '';
3435
3436     my $options = $cluster_conf->{options};
3437     $raw .= &$format_options($options) if $options && scalar(keys %$options);
3438
3439     my $aliases = $cluster_conf->{aliases};
3440     $raw .= &$format_aliases($aliases) if $aliases && scalar(keys %$aliases);
3441
3442     $raw .= &$format_ipsets($cluster_conf) if $cluster_conf->{ipset};
3443  
3444     my $rules = $cluster_conf->{rules};
3445     if ($rules && scalar(@$rules)) {
3446         $raw .= "[RULES]\n\n";
3447         $raw .= &$format_rules($rules, 1);
3448         $raw .= "\n";
3449     }
3450
3451     if ($cluster_conf->{groups}) {
3452         foreach my $group (sort keys %{$cluster_conf->{groups}}) {
3453             my $rules = $cluster_conf->{groups}->{$group};
3454             if (my $comment = $cluster_conf->{group_comments}->{$group}) {
3455                 my $utf8comment = encode('utf8', $comment);
3456                 $raw .= "[group $group] # $utf8comment\n\n";
3457             } else {
3458                 $raw .= "[group $group]\n\n";
3459             }
3460
3461             $raw .= &$format_rules($rules, 0);
3462             $raw .= "\n";
3463         }
3464     }
3465
3466     if ($raw) {
3467         mkdir $pvefw_conf_dir;
3468         PVE::Tools::file_set_contents($clusterfw_conf_filename, $raw);
3469     } else {
3470         unlink $clusterfw_conf_filename;
3471     }
3472 }
3473
3474 sub load_hostfw_conf {
3475     my ($cluster_conf, $filename) = @_;
3476
3477     $filename = $hostfw_conf_filename if !defined($filename);
3478
3479     my $empty_conf = { rules => [], options => {}};
3480     return generic_fw_config_parser($filename, $cluster_conf, $empty_conf, 'host');
3481 }
3482
3483 sub save_hostfw_conf {
3484     my ($hostfw_conf) = @_;
3485
3486     my $raw = '';
3487
3488     my $options = $hostfw_conf->{options};
3489     $raw .= &$format_options($options) if $options && scalar(keys %$options);
3490
3491     my $rules = $hostfw_conf->{rules};
3492     if ($rules && scalar(@$rules)) {
3493         $raw .= "[RULES]\n\n";
3494         $raw .= &$format_rules($rules, 1);
3495         $raw .= "\n";
3496     }
3497
3498     if ($raw) {
3499         PVE::Tools::file_set_contents($hostfw_conf_filename, $raw);
3500     } else {
3501         unlink $hostfw_conf_filename;
3502     }
3503 }
3504
3505 sub compile {
3506     my ($cluster_conf, $hostfw_conf, $vmdata, $corosync_conf) = @_;
3507
3508     my $vmfw_configs;
3509
3510     # fixme: once we read standard chains from config this needs to be put in test/standard cases below
3511     $pve_std_chains = dclone($pve_std_chains_conf);
3512
3513     if ($vmdata) { # test mode
3514         my $testdir = $vmdata->{testdir} || die "no test directory specified";
3515         my $filename = "$testdir/cluster.fw";
3516         $cluster_conf = load_clusterfw_conf($filename);
3517
3518         $filename = "$testdir/host.fw";
3519         $hostfw_conf = load_hostfw_conf($cluster_conf, $filename);
3520
3521         $vmfw_configs = read_vm_firewall_configs($cluster_conf, $vmdata, $testdir);
3522     } else { # normal operation
3523         $cluster_conf = load_clusterfw_conf(undef) if !$cluster_conf;
3524
3525         $hostfw_conf = load_hostfw_conf($cluster_conf, undef) if !$hostfw_conf;
3526
3527         # cfs_update is handled by daemon or API
3528         $corosync_conf = PVE::Cluster::cfs_read_file("corosync.conf") if !$corosync_conf;
3529
3530         $vmdata = read_local_vm_config();
3531         $vmfw_configs = read_vm_firewall_configs($cluster_conf, $vmdata, undef);
3532     }
3533
3534     return ({},{},{},{}) if !$cluster_conf->{options}->{enable};
3535
3536     my $localnet;
3537     if ($cluster_conf->{aliases}->{local_network}) {
3538         $localnet = $cluster_conf->{aliases}->{local_network}->{cidr};
3539     } else {
3540         my $localnet_ver;
3541         ($localnet, $localnet_ver) = parse_ip_or_cidr(local_network() || '127.0.0.0/8');
3542
3543         $cluster_conf->{aliases}->{local_network} = {
3544             name => 'local_network', cidr => $localnet, ipversion => $localnet_ver };
3545     }
3546
3547     push @{$cluster_conf->{ipset}->{management}}, { cidr => $localnet };
3548
3549     my $ruleset = compile_iptables_filter($cluster_conf, $hostfw_conf, $vmfw_configs, $vmdata, $corosync_conf, 4);
3550     my $rulesetv6 = compile_iptables_filter($cluster_conf, $hostfw_conf, $vmfw_configs, $vmdata, $corosync_conf, 6);
3551     my $ebtables_ruleset = compile_ebtables_filter($cluster_conf, $hostfw_conf, $vmfw_configs, $vmdata);
3552     my $ipset_ruleset = compile_ipsets($cluster_conf, $vmfw_configs, $vmdata);
3553
3554     return ($ruleset, $ipset_ruleset, $rulesetv6, $ebtables_ruleset);
3555 }
3556
3557 sub compile_iptables_filter {
3558     my ($cluster_conf, $hostfw_conf, $vmfw_configs, $vmdata, $corosync_conf, $ipversion) = @_;
3559
3560     my $ruleset = {};
3561
3562     ruleset_create_chain($ruleset, "PVEFW-INPUT");
3563     ruleset_create_chain($ruleset, "PVEFW-OUTPUT");
3564
3565     ruleset_create_chain($ruleset, "PVEFW-FORWARD");
3566
3567     my $hostfw_options = $hostfw_conf->{options} || {};
3568
3569     # fixme: what log level should we use here?
3570     my $loglevel = get_option_log_level($hostfw_options, "log_level_out");
3571
3572     my $conn_allow_invalid = $hostfw_options->{nf_conntrack_allow_invalid} // 0;
3573     ruleset_chain_add_conn_filters($ruleset, "PVEFW-FORWARD", $conn_allow_invalid, "ACCEPT");
3574
3575     ruleset_create_chain($ruleset, "PVEFW-FWBR-IN");
3576     ruleset_chain_add_input_filters($ruleset, "PVEFW-FWBR-IN", $ipversion, $hostfw_options, $cluster_conf, $loglevel);
3577
3578     ruleset_addrule($ruleset, "PVEFW-FORWARD", "-m physdev --physdev-is-bridged --physdev-in fwln+", "-j PVEFW-FWBR-IN");
3579
3580     ruleset_create_chain($ruleset, "PVEFW-FWBR-OUT");
3581     ruleset_addrule($ruleset, "PVEFW-FORWARD", "-m physdev --physdev-is-bridged --physdev-out fwln+", "-j PVEFW-FWBR-OUT");
3582
3583     generate_std_chains($ruleset, $hostfw_options, $ipversion);
3584
3585     my $hostfw_enable = !(defined($hostfw_options->{enable}) && ($hostfw_options->{enable} == 0));
3586
3587     if ($hostfw_enable) {
3588         eval { enable_host_firewall($ruleset, $hostfw_conf, $cluster_conf, $ipversion, $corosync_conf); };
3589         warn $@ if $@; # just to be sure - should not happen
3590     }
3591
3592     # generate firewall rules for QEMU VMs
3593     foreach my $vmid (sort keys %{$vmdata->{qemu}}) {
3594         eval {
3595             my $conf = $vmdata->{qemu}->{$vmid};
3596             my $vmfw_conf = $vmfw_configs->{$vmid};
3597             return if !$vmfw_conf;
3598
3599             foreach my $netid (sort keys %$conf) {
3600                 next if $netid !~ m/^net(\d+)$/;
3601                 my $net = PVE::QemuServer::parse_net($conf->{$netid});
3602                 next if !$net->{firewall};
3603                 my $iface = "tap${vmid}i$1";
3604
3605                 my $macaddr = $net->{macaddr};
3606                 generate_tap_rules_direction($ruleset, $cluster_conf, $iface, $netid, $macaddr,
3607                                              $vmfw_conf, $vmid, 'IN', $ipversion);
3608                 generate_tap_rules_direction($ruleset, $cluster_conf, $iface, $netid, $macaddr,
3609                                              $vmfw_conf, $vmid, 'OUT', $ipversion);
3610             }
3611         };
3612         warn $@ if $@; # just to be sure - should not happen
3613     }
3614
3615     # generate firewall rules for LXC containers
3616     foreach my $vmid (sort keys %{$vmdata->{lxc}}) {
3617         eval {
3618             my $conf = $vmdata->{lxc}->{$vmid};
3619             my $vmfw_conf = $vmfw_configs->{$vmid};
3620             return if !$vmfw_conf;
3621
3622             if ($vmfw_conf->{options}->{enable}) {
3623                 foreach my $netid (sort keys %$conf) {
3624                     next if $netid !~ m/^net(\d+)$/;
3625                     my $net = PVE::LXC::Config->parse_lxc_network($conf->{$netid});
3626                     next if !$net->{firewall};
3627                     my $iface = "veth${vmid}i$1";
3628                     my $macaddr = $net->{hwaddr};
3629                     generate_tap_rules_direction($ruleset, $cluster_conf, $iface, $netid, $macaddr,
3630                                                  $vmfw_conf, $vmid, 'IN', $ipversion);
3631                     generate_tap_rules_direction($ruleset, $cluster_conf, $iface, $netid, $macaddr,
3632                                                  $vmfw_conf, $vmid, 'OUT', $ipversion);
3633                 }
3634             }
3635         };
3636         warn $@ if $@; # just to be sure - should not happen
3637     }
3638
3639     if(ruleset_chain_exist($ruleset, "PVEFW-IPS")){
3640         ruleset_insertrule($ruleset, "PVEFW-FORWARD", "-m conntrack --ctstate RELATED,ESTABLISHED", "-j PVEFW-IPS");
3641     }
3642
3643     return $ruleset;
3644 }
3645
3646 sub mac_to_linklocal {
3647     my ($macaddr) = @_;
3648     my @parts = split(/:/, $macaddr);
3649     # The standard link local address uses the fe80::/64 prefix with the
3650     # modified EUI-64 identifier derived from the MAC address by flipping the
3651     # universal/local bit and inserting FF:FE in the middle.
3652     # See RFC 4291.
3653     $parts[0] = sprintf("%02x", hex($parts[0]) ^ 0x02);
3654     my @meui64 = (@parts[0,1,2], 'ff', 'fe', @parts[3,4,5]);
3655     return "fe80::$parts[0]$parts[1]:$parts[2]FF:FE$parts[3]:$parts[4]$parts[5]";
3656 }
3657
3658 sub compile_ipsets {
3659     my ($cluster_conf, $vmfw_configs, $vmdata) = @_;
3660
3661     my $localnet;
3662     if ($cluster_conf->{aliases}->{local_network}) {
3663         $localnet = $cluster_conf->{aliases}->{local_network}->{cidr};
3664     } else {
3665         my $localnet_ver;
3666         ($localnet, $localnet_ver) = parse_ip_or_cidr(local_network() || '127.0.0.0/8');
3667
3668         $cluster_conf->{aliases}->{local_network} = { 
3669             name => 'local_network', cidr => $localnet, ipversion => $localnet_ver };
3670     }
3671
3672     push @{$cluster_conf->{ipset}->{management}}, { cidr => $localnet };
3673
3674
3675     my $ipset_ruleset = {};
3676
3677     # generate ipsets for QEMU VMs
3678     foreach my $vmid (keys %{$vmdata->{qemu}}) {
3679         eval {
3680             my $conf = $vmdata->{qemu}->{$vmid};
3681             my $vmfw_conf = $vmfw_configs->{$vmid};
3682             return if !$vmfw_conf;
3683
3684             # When the 'ipfilter' option is enabled every device for which there
3685             # is no 'ipfilter-netX' ipset defiend gets an implicit empty default
3686             # ipset.
3687             # The reason is that ipfilter ipsets are always filled with standard
3688             # IPv6 link-local filters.
3689             my $ipsets = $vmfw_conf->{ipset};
3690             my $implicit_sets = {};
3691
3692             my $device_ips = {};
3693             foreach my $netid (keys %$conf) {
3694                 next if $netid !~ m/^net(\d+)$/;
3695                 my $net = PVE::QemuServer::parse_net($conf->{$netid});
3696                 next if !$net->{firewall};
3697
3698                 if ($vmfw_conf->{options}->{ipfilter} && !$ipsets->{"ipfilter-$netid"}) {
3699                     $implicit_sets->{"ipfilter-$netid"} = [];
3700                 }
3701
3702                 my $macaddr = $net->{macaddr};
3703                 my $linklocal = mac_to_linklocal($macaddr);
3704                 $device_ips->{$netid} = [
3705                     { cidr => $linklocal },
3706                     { cidr => 'fe80::/10', nomatch => 1 }
3707                 ];
3708             }
3709
3710             generate_ipset_chains($ipset_ruleset, $cluster_conf, $vmfw_conf, $device_ips, $ipsets);
3711             generate_ipset_chains($ipset_ruleset, $cluster_conf, $vmfw_conf, $device_ips, $implicit_sets);
3712         };
3713         warn $@ if $@; # just to be sure - should not happen
3714     }
3715
3716     # generate firewall rules for LXC containers
3717     foreach my $vmid (keys %{$vmdata->{lxc}}) {
3718         eval {
3719             my $conf = $vmdata->{lxc}->{$vmid};
3720             my $vmfw_conf = $vmfw_configs->{$vmid};
3721             return if !$vmfw_conf;
3722
3723             # When the 'ipfilter' option is enabled every device for which there
3724             # is no 'ipfilter-netX' ipset defiend gets an implicit empty default
3725             # ipset.
3726             # The reason is that ipfilter ipsets are always filled with standard
3727             # IPv6 link-local filters, as well as the IP addresses configured
3728             # for the container.
3729             my $ipsets = $vmfw_conf->{ipset};
3730             my $implicit_sets = {};
3731
3732             my $device_ips = {};
3733             foreach my $netid (keys %$conf) {
3734                 next if $netid !~ m/^net(\d+)$/;
3735                 my $net = PVE::LXC::Config->parse_lxc_network($conf->{$netid});
3736                 next if !$net->{firewall};
3737
3738                 if ($vmfw_conf->{options}->{ipfilter} && !$ipsets->{"ipfilter-$netid"}) {
3739                     $implicit_sets->{"ipfilter-$netid"} = [];
3740                 }
3741
3742                 my $macaddr = $net->{hwaddr};
3743                 my $linklocal = mac_to_linklocal($macaddr);
3744                 my $set = $device_ips->{$netid} = [
3745                     { cidr => $linklocal },
3746                     { cidr => 'fe80::/10', nomatch => 1 }
3747                 ];
3748                 if (defined($net->{ip}) && $net->{ip} =~ m!^($IPV4RE)(?:/\d+)?$!) {
3749                     push @$set, { cidr => $1 };
3750                 }
3751                 if (defined($net->{ip6}) && $net->{ip6} =~ m!^($IPV6RE)(?:/\d+)?$!) {
3752                     push @$set, { cidr => $1 };
3753                 }
3754             }
3755
3756             generate_ipset_chains($ipset_ruleset, $cluster_conf, $vmfw_conf, $device_ips, $ipsets);
3757             generate_ipset_chains($ipset_ruleset, $cluster_conf, $vmfw_conf, $device_ips, $implicit_sets);
3758         };
3759         warn $@ if $@; # just to be sure - should not happen
3760     }
3761
3762     generate_ipset_chains($ipset_ruleset, undef, $cluster_conf, undef, $cluster_conf->{ipset});
3763
3764     return $ipset_ruleset;
3765 }
3766
3767 sub compile_ebtables_filter {
3768     my ($cluster_conf, $hostfw_conf, $vmfw_configs, $vmdata) = @_;
3769
3770     if (!($cluster_conf->{options}->{ebtables} // 1)) {
3771         return {};
3772     }
3773
3774     my $ruleset = {};
3775
3776     ruleset_create_chain($ruleset, "PVEFW-FORWARD");
3777
3778     ruleset_create_chain($ruleset, "PVEFW-FWBR-OUT");
3779     #for ipv4 and ipv6, check macaddress in iptables, so we use conntrack 'ESTABLISHED', to speedup rules
3780     ruleset_addrule($ruleset, 'PVEFW-FORWARD', '-p IPv4', '-j ACCEPT');
3781     ruleset_addrule($ruleset, 'PVEFW-FORWARD', '-p IPv6', '-j ACCEPT');
3782     ruleset_addrule($ruleset, 'PVEFW-FORWARD', '-o fwln+', '-j PVEFW-FWBR-OUT');
3783
3784     # generate firewall rules for QEMU VMs
3785     foreach my $vmid (sort keys %{$vmdata->{qemu}}) {
3786         eval {
3787             my $conf = $vmdata->{qemu}->{$vmid};
3788             my $vmfw_conf = $vmfw_configs->{$vmid};
3789             return if !$vmfw_conf;
3790             my $ipsets = $vmfw_conf->{ipset};
3791
3792             foreach my $netid (sort keys %$conf) {
3793                 next if $netid !~ m/^net(\d+)$/;
3794                 my $net = PVE::QemuServer::parse_net($conf->{$netid});
3795                 next if !$net->{firewall};
3796                 my $iface = "tap${vmid}i$1";
3797                 my $macaddr = $net->{macaddr};
3798                 my $arpfilter = [];
3799                 if (defined(my $ipset = $ipsets->{"ipfilter-$netid"})) {
3800                     foreach my $ipaddr (@$ipset) {
3801                         my($ip, $version) = parse_ip_or_cidr($ipaddr->{cidr});
3802                         next if !$ip || ($version && $version != 4);
3803                         push(@$arpfilter, $ip);
3804                     }
3805                 }
3806                 generate_tap_layer2filter($ruleset, $iface, $macaddr, $vmfw_conf, $vmid, $arpfilter);
3807             }
3808         };
3809         warn $@ if $@; # just to be sure - should not happen
3810     }
3811
3812     # generate firewall rules for LXC containers
3813     foreach my $vmid (sort keys %{$vmdata->{lxc}}) {
3814         eval {
3815             my $conf = $vmdata->{lxc}->{$vmid};
3816
3817             my $vmfw_conf = $vmfw_configs->{$vmid};
3818             return if !$vmfw_conf || !$vmfw_conf->{options}->{enable};
3819             my $ipsets = $vmfw_conf->{ipset};
3820
3821             foreach my $netid (sort keys %$conf) {
3822                 next if $netid !~ m/^net(\d+)$/;
3823                 my $net = PVE::LXC::Config->parse_lxc_network($conf->{$netid});
3824                 next if !$net->{firewall};
3825                 my $iface = "veth${vmid}i$1";
3826                 my $macaddr = $net->{hwaddr};
3827                 my $arpfilter = [];
3828                 if (defined(my $ipset = $ipsets->{"ipfilter-$netid"})) {
3829                     foreach my $ipaddr (@$ipset) {
3830                         my($ip, $version) = parse_ip_or_cidr($ipaddr->{cidr});
3831                         next if !$ip || ($version && $version != 4);
3832                         push(@$arpfilter, $ip);
3833                     }
3834                 }
3835                 if (defined(my $ip = $net->{ip}) && $vmfw_conf->{options}->{ipfilter}) {
3836                     # ebtables changes this to a .0/MASK network but we just
3837                     # want the address here, no network - see #2193
3838                     $ip =~ s|/(\d+)$||;
3839                     push @$arpfilter, $ip;
3840                 }
3841                 generate_tap_layer2filter($ruleset, $iface, $macaddr, $vmfw_conf, $vmid, $arpfilter);
3842             }
3843         };
3844         warn $@ if $@; # just to be sure - should not happen
3845     }
3846
3847     return $ruleset;
3848 }
3849
3850 sub generate_tap_layer2filter {
3851     my ($ruleset, $iface, $macaddr, $vmfw_conf, $vmid, $arpfilter) = @_;
3852     my $options = $vmfw_conf->{options};
3853
3854     my $tapchain = $iface."-OUT";
3855
3856     # ebtables remove zeros from mac pairs
3857     $macaddr =~ s/0([0-9a-f])/$1/ig;
3858     $macaddr = lc($macaddr);
3859
3860     ruleset_create_chain($ruleset, $tapchain);
3861
3862     if (defined($macaddr) && !(defined($options->{macfilter}) && $options->{macfilter} == 0)) {
3863             ruleset_addrule($ruleset, $tapchain, "-s ! $macaddr", '-j DROP');
3864     }
3865
3866     if (@$arpfilter){
3867         my $arpchain = $tapchain."-ARP";
3868         ruleset_addrule($ruleset, $tapchain, "-p ARP", "-j $arpchain");
3869         ruleset_create_chain($ruleset, $arpchain);
3870
3871         foreach my $ip (@{$arpfilter}) {
3872             ruleset_addrule($ruleset, $arpchain, "-p ARP --arp-ip-src $ip", '-j RETURN');
3873         }
3874         ruleset_addrule($ruleset, $arpchain, '', '-j DROP');
3875     }
3876
3877     if (defined($options->{layer2_protocols})){
3878         my $protochain = $tapchain."-PROTO";
3879         ruleset_addrule($ruleset, $tapchain, '', "-j $protochain");
3880         ruleset_create_chain($ruleset, $protochain);
3881
3882         foreach my $proto (split(/,/, $options->{layer2_protocols})) {
3883             ruleset_addrule($ruleset, $protochain, "-p $proto", '-j RETURN');
3884         }
3885         ruleset_addrule($ruleset, $protochain, '', '-j DROP');
3886     }
3887
3888     ruleset_addrule($ruleset, $tapchain, '', '-j ACCEPT');
3889
3890     ruleset_addrule($ruleset, 'PVEFW-FWBR-OUT', "-i $iface", "-j $tapchain");
3891 }
3892
3893 # the parameter $change_only_regex changes two things if defined:
3894 # * all chains not matching it will be left intact
3895 # * both the $active_chains hash and the returned status_hash have different
3896 #   structure (they contain a key named 'rules').
3897 sub get_ruleset_status {
3898     my ($ruleset, $active_chains, $digest_fn, $change_only_regex) = @_;
3899
3900     my $statushash = {};
3901
3902     foreach my $chain (sort keys %$ruleset) {
3903         my $rules = $ruleset->{$chain};
3904         my $sig = &$digest_fn($rules);
3905         my $oldsig;
3906
3907         $statushash->{$chain}->{sig} = $sig;
3908         if (defined($change_only_regex)) {
3909             $oldsig = $active_chains->{$chain}->{sig};
3910             $statushash->{$chain}->{rules} = $rules;
3911         } else {
3912             $oldsig = $active_chains->{$chain};
3913         }
3914         if (!defined($oldsig)) {
3915             $statushash->{$chain}->{action} = 'create';
3916         } else {
3917             if ($oldsig eq $sig) {
3918                 $statushash->{$chain}->{action} = 'exists';
3919             } else {
3920                 $statushash->{$chain}->{action} = 'update';
3921             }
3922         }
3923         if ($verbose) {
3924             print "$statushash->{$chain}->{action} $chain ($sig)\n";
3925             foreach my $cmd (@{$rules}) {
3926                 print "\t$cmd\n";
3927             }
3928         }
3929     }
3930
3931     foreach my $chain (sort keys %$active_chains) {
3932         next if defined($ruleset->{$chain});
3933         my $action = 'delete';
3934         my $sig = $active_chains->{$chain};
3935         if (defined($change_only_regex)) {
3936             $action = 'ignore' if ($chain !~ m/$change_only_regex/);
3937             $statushash->{$chain}->{rules} = $active_chains->{$chain}->{rules};
3938             $sig = $sig->{sig};
3939         }
3940         $statushash->{$chain}->{action} = $action;
3941         $statushash->{$chain}->{sig} = $sig;
3942         print "$action $chain ($sig)\n" if $verbose;
3943     }
3944
3945     return $statushash;
3946 }
3947
3948 sub print_sig_rule {
3949     my ($chain, $sig) = @_;
3950
3951     # We just use this to store a SHA1 checksum used to detect changes
3952     return "-A $chain -m comment --comment \"PVESIG:$sig\"\n";
3953 }
3954
3955 sub get_ruleset_cmdlist {
3956     my ($ruleset, $iptablescmd) = @_;
3957
3958     my $cmdlist = "*filter\n"; # we pass this to iptables-restore;
3959
3960     my ($active_chains, $hooks) = iptables_get_chains($iptablescmd);
3961     my $statushash = get_ruleset_status($ruleset, $active_chains, \&iptables_chain_digest);
3962
3963     # create missing chains first
3964     foreach my $chain (sort keys %$ruleset) {
3965         my $stat = $statushash->{$chain};
3966         die "internal error" if !$stat;
3967         next if $stat->{action} ne 'create';
3968
3969         $cmdlist .= ":$chain - [0:0]\n";
3970     }
3971
3972     foreach my $h (qw(INPUT OUTPUT FORWARD)) {
3973         my $chain = "PVEFW-$h";
3974         if ($ruleset->{$chain} && !$hooks->{$h}) {
3975             $cmdlist .= "-A $h -j $chain\n";
3976         }
3977     }
3978
3979     foreach my $chain (sort keys %$ruleset) {
3980         my $stat = $statushash->{$chain};
3981         die "internal error" if !$stat;
3982
3983         if ($stat->{action} eq 'update' || $stat->{action} eq 'create') {
3984             $cmdlist .= "-F $chain\n";
3985             foreach my $cmd (@{$ruleset->{$chain}}) {
3986                 $cmdlist .= "$cmd\n";
3987             }
3988             $cmdlist .= print_sig_rule($chain, $stat->{sig});
3989         } elsif ($stat->{action} eq 'delete') {
3990             die "internal error"; # this should not happen
3991         } elsif ($stat->{action} eq 'exists') {
3992             # do nothing
3993         } else {
3994             die "internal error - unknown status '$stat->{action}'";
3995         }
3996     }
3997
3998     foreach my $chain (keys %$statushash) {
3999         next if $statushash->{$chain}->{action} ne 'delete';
4000         $cmdlist .= "-F $chain\n";
4001     }
4002     foreach my $chain (keys %$statushash) {
4003         next if $statushash->{$chain}->{action} ne 'delete';
4004         next if $chain eq 'PVEFW-INPUT';
4005         next if $chain eq 'PVEFW-OUTPUT';
4006         next if $chain eq 'PVEFW-FORWARD';
4007         $cmdlist .= "-X $chain\n";
4008     }
4009
4010     my $changes = $cmdlist ne "*filter\n" ? 1 : 0;
4011
4012     $cmdlist .= "COMMIT\n";
4013
4014     return wantarray ? ($cmdlist, $changes) : $cmdlist;
4015 }
4016
4017 my $pve_ebtables_chainname_regex = qr/PVEFW-\S+|(?:tap|veth)\d+i\d+-(?:IN|OUT)/;
4018
4019 sub get_ebtables_cmdlist {
4020     my ($ruleset) = @_;
4021
4022     my $changes = 0;
4023     my $cmdlist = "*filter\n";
4024
4025     my $active_chains = ebtables_get_chains();
4026     my $statushash = get_ruleset_status($ruleset, $active_chains,
4027                                         \&iptables_chain_digest,
4028                                         $pve_ebtables_chainname_regex);
4029
4030     # create chains first and make sure PVE rules are evaluated if active
4031     my $append_pve_to_forward = '-A FORWARD -j PVEFW-FORWARD';
4032     my $pve_include = 0;
4033     foreach my $chain (sort keys %$statushash) {
4034         next if ($statushash->{$chain}->{action} eq 'delete');
4035         $cmdlist .= ":$chain ACCEPT\n";
4036         $pve_include = 1 if ($chain eq 'PVEFW-FORWARD');
4037     }
4038
4039     foreach my $chain (sort keys %$statushash) {
4040         my $stat = $statushash->{$chain};
4041         next if ($stat->{action} eq 'delete');
4042         $changes = 1 if ($stat->{action} !~ 'ignore|exists');
4043
4044         foreach my $cmd (@{$statushash->{$chain}->{'rules'}}) {
4045             if ($chain eq 'FORWARD' && $cmd eq $append_pve_to_forward) {
4046                 next if ! $pve_include;
4047                 $pve_include = 0;
4048             }
4049             $cmdlist .= "$cmd\n";
4050         }
4051     }
4052     $cmdlist .= "$append_pve_to_forward\n" if $pve_include;
4053
4054     return wantarray ? ($cmdlist, $changes) : $cmdlist;
4055 }
4056
4057 sub get_ipset_cmdlist {
4058     my ($ruleset) = @_;
4059
4060     my $cmdlist = "";
4061
4062     my $delete_cmdlist = "";
4063
4064     my $active_chains = ipset_get_chains();
4065     my $statushash = get_ruleset_status($ruleset, $active_chains, \&ipset_chain_digest);
4066
4067     # remove stale _swap chains
4068     foreach my $chain (keys %$active_chains) {
4069         if ($chain =~ m/^PVEFW-\S+_swap$/) {
4070             $cmdlist .= "destroy $chain\n";
4071         }
4072     }
4073
4074     foreach my $chain (keys %$ruleset) {
4075         my $stat = $statushash->{$chain};
4076         die "internal error" if !$stat;
4077
4078         if ($stat->{action} eq 'create') {
4079             foreach my $cmd (@{$ruleset->{$chain}}) {
4080                 $cmdlist .= "$cmd\n";
4081             }
4082         }
4083     }
4084
4085     foreach my $chain (keys %$ruleset) {
4086         my $stat = $statushash->{$chain};
4087         die "internal error" if !$stat;
4088
4089         if ($stat->{action} eq 'update') {
4090             my $chain_swap = $chain."_swap";
4091
4092             foreach my $cmd (@{$ruleset->{$chain}}) {
4093                 $cmd =~ s/$chain/$chain_swap/;
4094                 $cmdlist .= "$cmd\n";
4095             }
4096             $cmdlist .= "swap $chain_swap $chain\n";
4097             $cmdlist .= "flush $chain_swap\n";
4098             $cmdlist .= "destroy $chain_swap\n";
4099         }
4100     }
4101
4102      # the remove unused chains
4103     foreach my $chain (keys %$statushash) {
4104         next if $statushash->{$chain}->{action} ne 'delete';
4105
4106         $delete_cmdlist .= "flush $chain\n";
4107         $delete_cmdlist .= "destroy $chain\n";
4108     }
4109
4110     my $changes = ($cmdlist || $delete_cmdlist) ? 1 : 0;
4111
4112     return ($cmdlist, $delete_cmdlist, $changes);
4113 }
4114
4115 sub apply_ruleset {
4116     my ($ruleset, $hostfw_conf, $ipset_ruleset, $rulesetv6, $ebtables_ruleset) = @_;
4117
4118     enable_bridge_firewall();
4119
4120     my ($ipset_create_cmdlist, $ipset_delete_cmdlist, $ipset_changes) =
4121         get_ipset_cmdlist($ipset_ruleset);
4122
4123     my ($cmdlist, $changes) = get_ruleset_cmdlist($ruleset);
4124     my ($cmdlistv6, $changesv6) = get_ruleset_cmdlist($rulesetv6, "ip6tables");
4125     my ($ebtables_cmdlist, $ebtables_changes) = get_ebtables_cmdlist($ebtables_ruleset);
4126
4127     if ($verbose) {
4128         if ($ipset_changes) {
4129             print "ipset changes:\n";
4130             print $ipset_create_cmdlist if $ipset_create_cmdlist;
4131             print $ipset_delete_cmdlist if $ipset_delete_cmdlist;
4132         }
4133
4134         if ($changes) {
4135             print "iptables changes:\n";
4136             print $cmdlist;
4137         }
4138
4139         if ($changesv6) {
4140             print "ip6tables changes:\n";
4141             print $cmdlistv6;
4142         }
4143
4144         if ($ebtables_changes) {
4145             print "ebtables changes:\n";
4146             print $ebtables_cmdlist;
4147         }
4148     }
4149
4150     my $tmpfile = "$pve_fw_status_dir/ipsetcmdlist1";
4151     PVE::Tools::file_set_contents($tmpfile, $ipset_create_cmdlist || '');
4152
4153     ipset_restore_cmdlist($ipset_create_cmdlist);
4154
4155     $tmpfile = "$pve_fw_status_dir/ip4cmdlist";
4156     PVE::Tools::file_set_contents($tmpfile, $cmdlist || '');
4157
4158     iptables_restore_cmdlist($cmdlist);
4159
4160     $tmpfile = "$pve_fw_status_dir/ip6cmdlist";
4161     PVE::Tools::file_set_contents($tmpfile, $cmdlistv6 || '');
4162
4163     ip6tables_restore_cmdlist($cmdlistv6);
4164
4165     $tmpfile = "$pve_fw_status_dir/ipsetcmdlist2";
4166     PVE::Tools::file_set_contents($tmpfile, $ipset_delete_cmdlist || '');
4167
4168     ipset_restore_cmdlist($ipset_delete_cmdlist) if $ipset_delete_cmdlist;
4169
4170     ebtables_restore_cmdlist($ebtables_cmdlist);
4171
4172     $tmpfile = "$pve_fw_status_dir/ebtablescmdlist";
4173     PVE::Tools::file_set_contents($tmpfile, $ebtables_cmdlist || '');
4174
4175     # test: re-read status and check if everything is up to date
4176     my $active_chains = iptables_get_chains();
4177     my $statushash = get_ruleset_status($ruleset, $active_chains, \&iptables_chain_digest);
4178
4179     my $errors;
4180     foreach my $chain (sort keys %$ruleset) {
4181         my $stat = $statushash->{$chain};
4182         if ($stat->{action} ne 'exists') {
4183             warn&n