corosync: refactor if conditions
[pve-firewall.git] / src / PVE / Firewall.pm
1 package PVE::Firewall;
2
3 use warnings;
4 use strict;
5
6 use Digest::SHA;
7 use Encode;
8 use File::Basename;
9 use File::Path;
10 use IO::File;
11 use Net::IP;
12 use POSIX;
13 use Socket qw(AF_INET AF_INET6 inet_ntop inet_pton);
14 use Storable qw(dclone);
15
16 use PVE::Cluster;
17 use PVE::Corosync;
18 use PVE::Exception qw(raise raise_param_exc);
19 use PVE::INotify;
20 use PVE::JSONSchema qw(register_standard_option get_standard_option);
21 use PVE::Network;
22 use PVE::ProcFSTools;
23 use PVE::SafeSyslog;
24 use PVE::Tools qw($IPV4RE $IPV6RE);
25 use PVE::Tools qw(run_command lock_file dir_glob_foreach);
26
27 my $pvefw_conf_dir = "/etc/pve/firewall";
28 my $clusterfw_conf_filename = "$pvefw_conf_dir/cluster.fw";
29
30 # dynamically include PVE::QemuServer and PVE::LXC
31 # to avoid dependency problems
32 my $have_qemu_server;
33 eval {
34     require PVE::QemuServer;
35     require PVE::QemuConfig;
36     $have_qemu_server = 1;
37 };
38
39 my $have_lxc;
40 eval {
41     require PVE::LXC;
42     $have_lxc = 1;
43 };
44
45 my $pve_fw_status_dir = "/var/lib/pve-firewall";
46
47 mkdir $pve_fw_status_dir; # make sure this exists
48
49 my $security_group_name_pattern = '[A-Za-z][A-Za-z0-9\-\_]+';
50 my $ipset_name_pattern = '[A-Za-z][A-Za-z0-9\-\_]+';
51 our $ip_alias_pattern = '[A-Za-z][A-Za-z0-9\-\_]+';
52
53 my $max_alias_name_length = 64;
54 my $max_ipset_name_length = 64;
55 my $max_group_name_length = 18;
56
57 my $PROTOCOLS_WITH_PORTS = {
58     udp => 1,     17 => 1,
59     udplite => 1, 136 => 1,
60     tcp => 1,     6 => 1,
61     dccp => 1,    33 => 1,
62     sctp => 1,    132 => 1,
63 };
64
65 PVE::JSONSchema::register_format('IPorCIDR', \&pve_verify_ip_or_cidr);
66 sub pve_verify_ip_or_cidr {
67     my ($cidr, $noerr) = @_;
68
69     if ($cidr =~ m!^(?:$IPV6RE|$IPV4RE)(/(\d+))?$!) {
70         return $cidr if Net::IP->new($cidr);
71         return undef if $noerr;
72         die Net::IP::Error() . "\n";
73     }
74     return undef if $noerr;
75     die "value does not look like a valid IP address or CIDR network\n";
76 }
77
78 PVE::JSONSchema::register_format('IPorCIDRorAlias', \&pve_verify_ip_or_cidr_or_alias);
79 sub pve_verify_ip_or_cidr_or_alias {
80     my ($cidr, $noerr) = @_;
81
82     return if $cidr =~ m/^(?:$ip_alias_pattern)$/;
83
84     return pve_verify_ip_or_cidr($cidr, $noerr);
85 }
86
87 PVE::JSONSchema::register_standard_option('ipset-name', {
88     description => "IP set name.",
89     type => 'string',
90     pattern => $ipset_name_pattern,
91     minLength => 2,
92     maxLength => $max_ipset_name_length,
93 });
94
95 PVE::JSONSchema::register_standard_option('pve-fw-alias', {
96     description => "Alias name.",
97     type => 'string',
98     pattern => $ip_alias_pattern,
99     minLength => 2,
100     maxLength => $max_alias_name_length,
101 });
102
103 PVE::JSONSchema::register_standard_option('pve-fw-loglevel' => {
104     description => "Log level.",
105     type => 'string',
106     enum => ['emerg', 'alert', 'crit', 'err', 'warning', 'notice', 'info', 'debug', 'nolog'],
107     optional => 1,
108 });
109
110 PVE::JSONSchema::register_standard_option('pve-security-group-name', {
111     description => "Security Group name.",
112     type => 'string',
113     pattern => $security_group_name_pattern,
114     minLength => 2,
115     maxLength => $max_group_name_length,
116 });
117
118 my $feature_ipset_nomatch = 0;
119 eval  {
120     my (undef, undef, $release) = POSIX::uname();
121     if ($release =~ m/^(\d+)\.(\d+)\.\d+-/) {
122         my ($major, $minor) = ($1, $2);
123         $feature_ipset_nomatch = 1 if ($major > 3) ||
124             ($major == 3 && $minor >= 7);
125     }
126
127 };
128
129 my $nodename = PVE::INotify::nodename();
130 my $hostfw_conf_filename = "/etc/pve/nodes/$nodename/host.fw";
131
132 my $pve_fw_lock_filename = "/var/lock/pvefw.lck";
133
134 my $default_log_level = 'nolog'; # avoid logs by default
135 my $global_log_ratelimit = '--limit 1/sec';
136
137 my $log_level_hash = {
138     debug => 7,
139     info => 6,
140     notice => 5,
141     warning => 4,
142     err => 3,
143     crit => 2,
144     alert => 1,
145     emerg => 0,
146 };
147
148 my $verbose = 0;
149 sub set_verbose {
150     $verbose = shift;
151 }
152
153 # %rule
154 #
155 # name => optional
156 # enable => [0|1]
157 # action =>
158 # proto =>
159 # sport => port[,port[,port]].. or port:port
160 # dport => port[,port[,port]].. or port:port
161 # log => optional, loglevel
162 # logmsg => optional, logmsg - overwrites default
163 # iface_in => incomin interface
164 # iface_out => outgoing interface
165 # match => optional, overwrites generation of match
166 # target => optional, overwrites action
167
168 # we need to overwrite some macros for ipv6
169 my $pve_ipv6fw_macros = {
170     'Ping' => [
171         { action => 'PARAM', proto => 'icmpv6', dport => 'echo-request' },
172     ],
173     'NeighborDiscovery' => [
174         "IPv6 neighbor solicitation, neighbor and router advertisement",
175         { action => 'PARAM', proto => 'icmpv6', dport => 'router-solicitation' },
176         { action => 'PARAM', proto => 'icmpv6', dport => 'router-advertisement' },
177         { action => 'PARAM', proto => 'icmpv6', dport => 'neighbor-solicitation' },
178         { action => 'PARAM', proto => 'icmpv6', dport => 'neighbor-advertisement' },
179     ],
180     'DHCPv6' => [
181         "DHCPv6 traffic",
182         { action => 'PARAM', proto => 'udp', dport => '546:547', sport => '546:547' },
183     ],
184     'Trcrt' => [
185         { action => 'PARAM', proto => 'udp', dport => '33434:33524' },
186         { action => 'PARAM', proto => 'icmpv6', dport => 'echo-request' },
187     ],
188  };
189
190 # imported/converted from: /usr/share/shorewall/macro.*
191 my $pve_fw_macros = {
192     'Amanda' => [
193         "Amanda Backup",
194         { action => 'PARAM', proto => 'udp', dport => '10080' },
195         { action => 'PARAM', proto => 'tcp', dport => '10080' },
196     ],
197     'Auth' => [
198         "Auth (identd) traffic",
199         { action => 'PARAM', proto => 'tcp', dport => '113' },
200     ],
201     'BGP' => [
202         "Border Gateway Protocol traffic",
203         { action => 'PARAM', proto => 'tcp', dport => '179' },
204     ],
205     'BitTorrent' => [
206         "BitTorrent traffic for BitTorrent 3.1 and earlier",
207         { action => 'PARAM', proto => 'tcp', dport => '6881:6889' },
208         { action => 'PARAM', proto => 'udp', dport => '6881' },
209     ],
210     'BitTorrent32' => [
211         "BitTorrent traffic for BitTorrent 3.2 and later",
212         { action => 'PARAM', proto => 'tcp', dport => '6881:6999' },
213         { action => 'PARAM', proto => 'udp', dport => '6881' },
214     ],
215     'Ceph' => [
216         "Ceph Storage Cluster traffic (Ceph Monitors, OSD & MDS Deamons)",
217         { action => 'PARAM', proto => 'tcp', dport => '6789' },
218         { action => 'PARAM', proto => 'tcp', dport => '6800:7300' },
219     ],
220     'CVS' => [
221         "Concurrent Versions System pserver traffic",
222         { action => 'PARAM', proto => 'tcp', dport => '2401' },
223     ],
224     'Citrix' => [
225         "Citrix/ICA traffic (ICA, ICA Browser, CGP)",
226         { action => 'PARAM', proto => 'tcp', dport => '1494' },
227         { action => 'PARAM', proto => 'udp', dport => '1604' },
228         { action => 'PARAM', proto => 'tcp', dport => '2598' },
229     ],
230     'DAAP' => [
231         "Digital Audio Access Protocol traffic (iTunes, Rythmbox daemons)",
232         { action => 'PARAM', proto => 'tcp', dport => '3689' },
233         { action => 'PARAM', proto => 'udp', dport => '3689' },
234     ],
235     'DCC' => [
236         "Distributed Checksum Clearinghouse spam filtering mechanism",
237         { action => 'PARAM', proto => 'tcp', dport => '6277' },
238     ],
239     'DHCPfwd' => [
240         "Forwarded DHCP traffic",
241         { action => 'PARAM', proto => 'udp', dport => '67:68', sport => '67:68' },
242     ],
243     'DNS' => [
244         "Domain Name System traffic (upd and tcp)",
245         { action => 'PARAM', proto => 'udp', dport => '53' },
246         { action => 'PARAM', proto => 'tcp', dport => '53' },
247     ],
248     'Distcc' => [
249         "Distributed Compiler service",
250         { action => 'PARAM', proto => 'tcp', dport => '3632' },
251     ],
252     'FTP' => [
253         "File Transfer Protocol",
254         { action => 'PARAM', proto => 'tcp', dport => '21' },
255     ],
256     'Finger' => [
257         "Finger protocol (RFC 742)",
258         { action => 'PARAM', proto => 'tcp', dport => '79' },
259     ],
260     'GNUnet' => [
261         "GNUnet secure peer-to-peer networking traffic",
262         { action => 'PARAM', proto => 'tcp', dport => '2086' },
263         { action => 'PARAM', proto => 'udp', dport => '2086' },
264         { action => 'PARAM', proto => 'tcp', dport => '1080' },
265         { action => 'PARAM', proto => 'udp', dport => '1080' },
266     ],
267     'GRE' => [
268         "Generic Routing Encapsulation tunneling protocol",
269         { action => 'PARAM', proto => '47' },
270     ],
271     'Git' => [
272         "Git distributed revision control traffic",
273         { action => 'PARAM', proto => 'tcp', dport => '9418' },
274     ],
275     'HKP' => [
276         "OpenPGP HTTP keyserver protocol traffic",
277         { action => 'PARAM', proto => 'tcp', dport => '11371' },
278     ],
279     'HTTP' => [
280         "Hypertext Transfer Protocol (WWW)",
281         { action => 'PARAM', proto => 'tcp', dport => '80' },
282     ],
283     'HTTPS' => [
284         "Hypertext Transfer Protocol (WWW) over SSL",
285         { action => 'PARAM', proto => 'tcp', dport => '443' },
286     ],
287     'ICPV2' => [
288         "Internet Cache Protocol V2 (Squid) traffic",
289         { action => 'PARAM', proto => 'udp', dport => '3130' },
290     ],
291     'ICQ' => [
292         "AOL Instant Messenger traffic",
293         { action => 'PARAM', proto => 'tcp', dport => '5190' },
294     ],
295     'IMAP' => [
296         "Internet Message Access Protocol",
297         { action => 'PARAM', proto => 'tcp', dport => '143' },
298     ],
299     'IMAPS' => [
300         "Internet Message Access Protocol over SSL",
301         { action => 'PARAM', proto => 'tcp', dport => '993' },
302     ],
303     'IPIP' => [
304         "IPIP capsulation traffic",
305         { action => 'PARAM', proto => '94' },
306     ],
307     'IPsec' => [
308         "IPsec traffic",
309         { action => 'PARAM', proto => 'udp', dport => '500', sport => '500' },
310         { action => 'PARAM', proto => '50' },
311     ],
312     'IPsecah' => [
313         "IPsec authentication (AH) traffic",
314         { action => 'PARAM', proto => 'udp', dport => '500', sport => '500' },
315         { action => 'PARAM', proto => '51' },
316     ],
317     'IPsecnat' => [
318         "IPsec traffic and Nat-Traversal",
319         { action => 'PARAM', proto => 'udp', dport => '500' },
320         { action => 'PARAM', proto => 'udp', dport => '4500' },
321         { action => 'PARAM', proto => '50' },
322     ],
323     'IRC' => [
324         "Internet Relay Chat traffic",
325         { action => 'PARAM', proto => 'tcp', dport => '6667' },
326     ],
327     'Jetdirect' => [
328         "HP Jetdirect printing",
329         { action => 'PARAM', proto => 'tcp', dport => '9100' },
330     ],
331     'L2TP' => [
332         "Layer 2 Tunneling Protocol traffic",
333         { action => 'PARAM', proto => 'udp', dport => '1701' },
334     ],
335     'LDAP' => [
336         "Lightweight Directory Access Protocol traffic",
337         { action => 'PARAM', proto => 'tcp', dport => '389' },
338     ],
339     'LDAPS' => [
340         "Secure Lightweight Directory Access Protocol traffic",
341         { action => 'PARAM', proto => 'tcp', dport => '636' },
342     ],
343     'MSNP' => [
344         "Microsoft Notification Protocol",
345         { action => 'PARAM', proto => 'tcp', dport => '1863' },
346     ],
347     'MSSQL' => [
348         "Microsoft SQL Server",
349         { action => 'PARAM', proto => 'tcp', dport => '1433' },
350     ],
351     'Mail' => [
352         "Mail traffic (SMTP, SMTPS, Submission)",
353         { action => 'PARAM', proto => 'tcp', dport => '25' },
354         { action => 'PARAM', proto => 'tcp', dport => '465' },
355         { action => 'PARAM', proto => 'tcp', dport => '587' },
356     ],
357     'MDNS' => [
358         "Multicast DNS",
359         { action => 'PARAM', proto => 'udp', dport => '5353' },
360     ],
361     'Munin' => [
362         "Munin networked resource monitoring traffic",
363         { action => 'PARAM', proto => 'tcp', dport => '4949' },
364     ],
365     'MySQL' => [
366         "MySQL server",
367         { action => 'PARAM', proto => 'tcp', dport => '3306' },
368     ],
369     'NNTP' => [
370         "NNTP traffic (Usenet).",
371         { action => 'PARAM', proto => 'tcp', dport => '119' },
372     ],
373     'NNTPS' => [
374         "Encrypted NNTP traffic (Usenet)",
375         { action => 'PARAM', proto => 'tcp', dport => '563' },
376     ],
377     'NTP' => [
378         "Network Time Protocol (ntpd)",
379         { action => 'PARAM', proto => 'udp', dport => '123' },
380     ],
381     'OSPF' => [
382         "OSPF multicast traffic",
383         { action => 'PARAM', proto => '89' },
384     ],
385     'OpenVPN' => [
386         "OpenVPN traffic",
387         { action => 'PARAM', proto => 'udp', dport => '1194' },
388     ],
389     'PCA' => [
390         "Symantec PCAnywere (tm)",
391         { action => 'PARAM', proto => 'udp', dport => '5632' },
392         { action => 'PARAM', proto => 'tcp', dport => '5631' },
393     ],
394     'POP3' => [
395         "POP3 traffic",
396         { action => 'PARAM', proto => 'tcp', dport => '110' },
397     ],
398     'POP3S' => [
399         "Encrypted POP3 traffic",
400         { action => 'PARAM', proto => 'tcp', dport => '995' },
401     ],
402     'PPtP' => [
403         "Point-to-Point Tunneling Protocol",
404         { action => 'PARAM', proto => '47' },
405         { action => 'PARAM', proto => 'tcp', dport => '1723' },
406     ],
407     'Ping' => [
408         "ICMP echo request",
409         { action => 'PARAM', proto => 'icmp', dport => 'echo-request' },
410     ],
411     'PostgreSQL' => [
412         "PostgreSQL server",
413         { action => 'PARAM', proto => 'tcp', dport => '5432' },
414     ],
415     'Printer' => [
416         "Line Printer protocol printing",
417         { action => 'PARAM', proto => 'tcp', dport => '515' },
418     ],
419     'RDP' => [
420         "Microsoft Remote Desktop Protocol traffic",
421         { action => 'PARAM', proto => 'tcp', dport => '3389' },
422     ],
423     'RIP' => [
424         "Routing Information Protocol (bidirectional)",
425         { action => 'PARAM', proto => 'udp', dport => '520' },
426     ],
427     'RNDC' => [
428         "BIND remote management protocol",
429         { action => 'PARAM', proto => 'tcp', dport => '953' },
430     ],
431     'Razor' => [
432         "Razor Antispam System",
433         { action => 'PARAM', proto => 'tcp', dport => '2703' },
434     ],
435     'Rdate' => [
436         "Remote time retrieval (rdate)",
437         { action => 'PARAM', proto => 'tcp', dport => '37' },
438     ],
439     'Rsync' => [
440         "Rsync server",
441         { action => 'PARAM', proto => 'tcp', dport => '873' },
442     ],
443     'SANE' => [
444         "SANE network scanning",
445         { action => 'PARAM', proto => 'tcp', dport => '6566' },
446     ],
447     'SMB' => [
448         "Microsoft SMB traffic",
449         { action => 'PARAM', proto => 'udp', dport => '135,445' },
450         { action => 'PARAM', proto => 'udp', dport => '137:139' },
451         { action => 'PARAM', proto => 'udp', dport => '1024:65535', sport => '137' },
452         { action => 'PARAM', proto => 'tcp', dport => '135,139,445' },
453     ],
454     'SMBswat' => [
455         "Samba Web Administration Tool",
456         { action => 'PARAM', proto => 'tcp', dport => '901' },
457     ],
458     'SMTP' => [
459         "Simple Mail Transfer Protocol",
460         { action => 'PARAM', proto => 'tcp', dport => '25' },
461     ],
462     'SMTPS' => [
463         "Encrypted Simple Mail Transfer Protocol",
464         { action => 'PARAM', proto => 'tcp', dport => '465' },
465     ],
466     'SNMP' => [
467         "Simple Network Management Protocol",
468         { action => 'PARAM', proto => 'udp', dport => '161:162' },
469         { action => 'PARAM', proto => 'tcp', dport => '161' },
470     ],
471     'SPAMD' => [
472         "Spam Assassin SPAMD traffic",
473         { action => 'PARAM', proto => 'tcp', dport => '783' },
474     ],
475     'SSH' => [
476         "Secure shell traffic",
477         { action => 'PARAM', proto => 'tcp', dport => '22' },
478     ],
479     'SVN' => [
480         "Subversion server (svnserve)",
481         { action => 'PARAM', proto => 'tcp', dport => '3690' },
482     ],
483     'SixXS' => [
484         "SixXS IPv6 Deployment and Tunnel Broker",
485         { action => 'PARAM', proto => 'tcp', dport => '3874' },
486         { action => 'PARAM', proto => 'udp', dport => '3740' },
487         { action => 'PARAM', proto => '41' },
488         { action => 'PARAM', proto => 'udp', dport => '5072,8374' },
489     ],
490     'Squid' => [
491         "Squid web proxy traffic",
492         { action => 'PARAM', proto => 'tcp', dport => '3128' },
493     ],
494     'Submission' => [
495         "Mail message submission traffic",
496         { action => 'PARAM', proto => 'tcp', dport => '587' },
497     ],
498     'Syslog' => [
499         "Syslog protocol (RFC 5424) traffic",
500         { action => 'PARAM', proto => 'udp', dport => '514' },
501         { action => 'PARAM', proto => 'tcp', dport => '514' },
502     ],
503     'TFTP' => [
504         "Trivial File Transfer Protocol traffic",
505         { action => 'PARAM', proto => 'udp', dport => '69' },
506     ],
507     'Telnet' => [
508         "Telnet traffic",
509         { action => 'PARAM', proto => 'tcp', dport => '23' },
510     ],
511     'Telnets' => [
512         "Telnet over SSL",
513         { action => 'PARAM', proto => 'tcp', dport => '992' },
514     ],
515     'Time' => [
516         "RFC 868 Time protocol",
517         { action => 'PARAM', proto => 'tcp', dport => '37' },
518     ],
519     'Trcrt' => [
520         "Traceroute (for up to 30 hops) traffic",
521         { action => 'PARAM', proto => 'udp', dport => '33434:33524' },
522         { action => 'PARAM', proto => 'icmp', dport => 'echo-request' },
523     ],
524     'VNC' => [
525         "VNC traffic for VNC display's 0 - 99",
526         { action => 'PARAM', proto => 'tcp', dport => '5900:5999' },
527     ],
528     'VNCL' => [
529         "VNC traffic from Vncservers to Vncviewers in listen mode",
530         { action => 'PARAM', proto => 'tcp', dport => '5500' },
531     ],
532     'Web' => [
533         "WWW traffic (HTTP and HTTPS)",
534         { action => 'PARAM', proto => 'tcp', dport => '80' },
535         { action => 'PARAM', proto => 'tcp', dport => '443' },
536     ],
537     'Webcache' => [
538         "Web Cache/Proxy traffic (port 8080)",
539         { action => 'PARAM', proto => 'tcp', dport => '8080' },
540     ],
541     'Webmin' => [
542         "Webmin traffic",
543         { action => 'PARAM', proto => 'tcp', dport => '10000' },
544     ],
545     'Whois' => [
546         "Whois (nicname, RFC 3912) traffic",
547         { action => 'PARAM', proto => 'tcp', dport => '43' },
548     ],
549 };
550
551 my $pve_fw_parsed_macros;
552 my $pve_fw_macro_descr;
553 my $pve_fw_macro_ipversion = {};
554 my $pve_fw_preferred_macro_names = {};
555
556 my $FWACCEPTMARK_ON  = "0x80000000/0x80000000";
557 my $FWACCEPTMARK_OFF = "0x00000000/0x80000000";
558
559 my $pve_std_chains = {};
560 my $pve_std_chains_conf = {};
561 $pve_std_chains_conf->{4} = {
562     'PVEFW-SET-ACCEPT-MARK' => [
563         { target => "-j MARK --set-mark $FWACCEPTMARK_ON" },
564     ],
565     'PVEFW-DropBroadcast' => [
566         # same as shorewall 'Broadcast'
567         # simply DROP BROADCAST/MULTICAST/ANYCAST
568         # we can use this to reduce logging
569         { action => 'DROP', dsttype => 'BROADCAST' },
570         { action => 'DROP', dsttype => 'MULTICAST' },
571         { action => 'DROP', dsttype => 'ANYCAST' },
572         { action => 'DROP', dest => '224.0.0.0/4' },
573     ],
574     'PVEFW-reject' => [
575         # same as shorewall 'reject'
576         { action => 'DROP', dsttype => 'BROADCAST' },
577         { action => 'DROP', source => '224.0.0.0/4' },
578         { action => 'DROP', proto => 'icmp' },
579         { match => '-p tcp', target => '-j REJECT --reject-with tcp-reset' },
580         { match => '-p udp', target => '-j REJECT --reject-with icmp-port-unreachable' },
581         { match => '-p icmp', target => '-j REJECT --reject-with icmp-host-unreachable' },
582         { target => '-j REJECT --reject-with icmp-host-prohibited' },
583     ],
584     'PVEFW-Drop' => [
585         # same as shorewall 'Drop', which is equal to DROP,
586         # but REJECT/DROP some packages to reduce logging,
587         # and ACCEPT critical ICMP types
588         { action => 'PVEFW-reject',  proto => 'tcp', dport => '43' }, # REJECT 'auth'
589         # we are not interested in BROADCAST/MULTICAST/ANYCAST
590         { action => 'PVEFW-DropBroadcast' },
591         # ACCEPT critical ICMP types
592         { action => 'ACCEPT', proto => 'icmp', dport => 'fragmentation-needed' },
593         { action => 'ACCEPT', proto => 'icmp', dport => 'time-exceeded' },
594         # Drop packets with INVALID state
595         { action => 'DROP', match => '-m conntrack --ctstate INVALID', },
596         # Drop Microsoft SMB noise
597         { action => 'DROP', proto => 'udp', dport => '135,445' },
598         { action => 'DROP', proto => 'udp', dport => '137:139' },
599         { action => 'DROP', proto => 'udp', dport => '1024:65535', sport => 137 },
600         { action => 'DROP', proto => 'tcp', dport => '135,139,445' },
601         { action => 'DROP', proto => 'udp', dport => 1900 }, # UPnP
602         # Drop new/NotSyn traffic so that it doesn't get logged
603         { action => 'DROP', match => '-p tcp -m tcp ! --tcp-flags FIN,SYN,RST,ACK SYN' },
604         # Drop DNS replies
605         { action => 'DROP', proto => 'udp', sport => 53 },
606     ],
607     'PVEFW-Reject' => [
608         # same as shorewall 'Reject', which is equal to Reject,
609         # but REJECT/DROP some packages to reduce logging,
610         # and ACCEPT critical ICMP types
611         { action => 'PVEFW-reject',  proto => 'tcp', dport => '43' }, # REJECT 'auth'
612         # we are not interested in BROADCAST/MULTICAST/ANYCAST
613         { action => 'PVEFW-DropBroadcast' },
614         # ACCEPT critical ICMP types
615         { action => 'ACCEPT', proto => 'icmp', dport => 'fragmentation-needed' },
616         { action => 'ACCEPT', proto => 'icmp', dport => 'time-exceeded' },
617         # Drop packets with INVALID state
618         { action => 'DROP', match => '-m conntrack --ctstate INVALID', },
619         # Drop Microsoft SMB noise
620         { action => 'PVEFW-reject', proto => 'udp', dport => '135,445' },
621         { action => 'PVEFW-reject', proto => 'udp', dport => '137:139'},
622         { action => 'PVEFW-reject', proto => 'udp', dport => '1024:65535', sport => 137 },
623         { action => 'PVEFW-reject', proto => 'tcp', dport => '135,139,445' },
624         { action => 'DROP', proto => 'udp', dport => 1900 }, # UPnP
625         # Drop new/NotSyn traffic so that it doesn't get logged
626         { action => 'DROP', match => '-p tcp -m tcp ! --tcp-flags FIN,SYN,RST,ACK SYN' },
627         # Drop DNS replies
628         { action => 'DROP', proto => 'udp', sport => 53 },
629     ],
630     'PVEFW-tcpflags' => [
631         # same as shorewall tcpflags action.
632         # Packets arriving on this interface are checked for som illegal combinations of TCP flags
633         { match => '-p tcp -m tcp --tcp-flags FIN,SYN,RST,PSH,ACK,URG FIN,PSH,URG', target => '-g PVEFW-logflags' },
634         { match => '-p tcp -m tcp --tcp-flags FIN,SYN,RST,PSH,ACK,URG NONE', target => '-g PVEFW-logflags' },
635         { match => '-p tcp -m tcp --tcp-flags SYN,RST SYN,RST', target => '-g PVEFW-logflags' },
636         { match => '-p tcp -m tcp --tcp-flags FIN,SYN FIN,SYN', target => '-g PVEFW-logflags' },
637         { match => '-p tcp -m tcp --sport 0 --tcp-flags FIN,SYN,RST,ACK SYN', target => '-g PVEFW-logflags' },
638     ],
639     'PVEFW-smurfs' => [
640         # same as shorewall smurfs action
641         # Filter packets for smurfs (packets with a broadcast address as the source).
642         { match => '-s 0.0.0.0/32', target => '-j RETURN' }, # allow DHCP
643         { match => '-m addrtype --src-type BROADCAST', target => '-g PVEFW-smurflog' },
644         { match => '-s 224.0.0.0/4', target => '-g PVEFW-smurflog' },
645     ],
646     'PVEFW-smurflog' => [
647         { action => 'DROP', logmsg => 'DROP: ' },
648     ],
649     'PVEFW-logflags' => [
650         { action => 'DROP', logmsg => 'DROP: ' },
651     ],
652 };
653
654 $pve_std_chains_conf->{6} = {
655     'PVEFW-SET-ACCEPT-MARK' => [
656         { target => "-j MARK --set-mark $FWACCEPTMARK_ON" },
657     ],
658     'PVEFW-DropBroadcast' => [
659         # same as shorewall 'Broadcast'
660         # simply DROP BROADCAST/MULTICAST/ANYCAST
661         # we can use this to reduce logging
662         #{ action => 'DROP', dsttype => 'BROADCAST' }, #no broadcast in ipv6
663         # ipv6 addrtype does not work with kernel 2.6.32
664         #{ action => 'DROP', dsttype => 'MULTICAST' },
665         #{ action => 'DROP', dsttype => 'ANYCAST' },
666         { action => 'DROP', dest => 'ff00::/8' },
667         #{ action => 'DROP', dest => '224.0.0.0/4' },
668     ],
669     'PVEFW-reject' => [
670         { action => 'DROP', proto => 'icmpv6' },
671         { match => '-p tcp', target => '-j REJECT --reject-with tcp-reset' },
672         { match => '-p udp', target => '-j REJECT --reject-with icmp6-port-unreachable' },
673         { target => '-j REJECT --reject-with icmp6-adm-prohibited' },
674     ],
675     'PVEFW-Drop' => [
676         # same as shorewall 'Drop', which is equal to DROP,
677         # but REJECT/DROP some packages to reduce logging,
678         # and ACCEPT critical ICMP types
679         { action => 'PVEFW-reject', proto => 'tcp', dport => '43' }, # REJECT 'auth'
680         # we are not interested in BROADCAST/MULTICAST/ANYCAST
681         { action => 'PVEFW-DropBroadcast' },
682         # ACCEPT critical ICMP types
683         { action => 'ACCEPT', proto => 'icmpv6', dport => 'destination-unreachable' },
684         { action => 'ACCEPT', proto => 'icmpv6', dport => 'time-exceeded' },
685         { action => 'ACCEPT', proto => 'icmpv6', dport => 'packet-too-big' },
686         # Drop packets with INVALID state
687         { action => 'DROP', match => '-m conntrack --ctstate INVALID', },
688         # Drop Microsoft SMB noise
689         { action => 'DROP', proto => 'udp', dport => '135,445' },
690         { action => 'DROP', proto => 'udp', dport => '137:139'},
691         { action => 'DROP', proto => 'udp', dport => '1024:65535', sport => 137 },
692         { action => 'DROP', proto => 'tcp', dport => '135,139,445' },
693         { action => 'DROP', proto => 'udp', dport => 1900 }, # UPnP
694         # Drop new/NotSyn traffic so that it doesn't get logged
695         { action => 'DROP', match => '-p tcp -m tcp ! --tcp-flags FIN,SYN,RST,ACK SYN' },
696         # Drop DNS replies
697         { action => 'DROP', proto => 'udp', sport => 53 },
698     ],
699     'PVEFW-Reject' => [
700         # same as shorewall 'Reject', which is equal to Reject,
701         # but REJECT/DROP some packages to reduce logging,
702         # and ACCEPT critical ICMP types
703         { action => 'PVEFW-reject',  proto => 'tcp', dport => '43' }, # REJECT 'auth'
704         # we are not interested in BROADCAST/MULTICAST/ANYCAST
705         { action => 'PVEFW-DropBroadcast' },
706         # ACCEPT critical ICMP types
707         { action => 'ACCEPT', proto => 'icmpv6', dport => 'destination-unreachable' },
708         { action => 'ACCEPT', proto => 'icmpv6', dport => 'time-exceeded' },
709         { action => 'ACCEPT', proto => 'icmpv6', dport => 'packet-too-big' },
710         # Drop packets with INVALID state
711         { action => 'DROP', match => '-m conntrack --ctstate INVALID', },
712         # Drop Microsoft SMB noise
713         { action => 'PVEFW-reject', proto => 'udp', dport => '135,445' },
714         { action => 'PVEFW-reject', proto => 'udp', dport => '137:139' },
715         { action => 'PVEFW-reject', proto => 'udp', dport => '1024:65535', sport => 137 },
716         { action => 'PVEFW-reject', proto => 'tcp', dport => '135,139,445' },
717         { action => 'DROP', proto => 'udp', dport => 1900 }, # UPnP
718         # Drop new/NotSyn traffic so that it doesn't get logged
719         { action => 'DROP', match => '-p tcp -m tcp ! --tcp-flags FIN,SYN,RST,ACK SYN' },
720         # Drop DNS replies
721         { action => 'DROP', proto => 'udp', sport => 53 },
722     ],
723     'PVEFW-tcpflags' => [
724         # same as shorewall tcpflags action.
725         # Packets arriving on this interface are checked for som illegal combinations of TCP flags
726         { match => '-p tcp -m tcp --tcp-flags FIN,SYN,RST,PSH,ACK,URG FIN,PSH,URG', target => '-g PVEFW-logflags' },
727         { match => '-p tcp -m tcp --tcp-flags FIN,SYN,RST,PSH,ACK,URG NONE', target => '-g PVEFW-logflags' },
728         { match => '-p tcp -m tcp --tcp-flags SYN,RST SYN,RST', target => '-g PVEFW-logflags' },
729         { match => '-p tcp -m tcp --tcp-flags FIN,SYN FIN,SYN', target => '-g PVEFW-logflags' },
730         { match => '-p tcp -m tcp --sport 0 --tcp-flags FIN,SYN,RST,ACK SYN', target => '-g PVEFW-logflags' },
731     ],
732     'PVEFW-logflags' => [
733         { action => 'DROP', logmsg => 'DROP: ' },
734     ],
735 };
736
737 # iptables -p icmp -h
738 my $icmp_type_names = {
739     any => 1,
740     'echo-reply' => 1,
741     'destination-unreachable' => 1,
742     'network-unreachable' => 1,
743     'host-unreachable' => 1,
744     'protocol-unreachable' => 1,
745     'port-unreachable' => 1,
746     'fragmentation-needed' => 1,
747     'source-route-failed' => 1,
748     'network-unknown' => 1,
749     'host-unknown' => 1,
750     'network-prohibited' => 1,
751     'host-prohibited' => 1,
752     'TOS-network-unreachable' => 1,
753     'TOS-host-unreachable' => 1,
754     'communication-prohibited' => 1,
755     'host-precedence-violation' => 1,
756     'precedence-cutoff' => 1,
757     'source-quench' => 1,
758     'redirect' => 1,
759     'network-redirect' => 1,
760     'host-redirect' => 1,
761     'TOS-network-redirect' => 1,
762     'TOS-host-redirect' => 1,
763     'echo-request' => 1,
764     'router-advertisement' => 1,
765     'router-solicitation' => 1,
766     'time-exceeded' => 1,
767     'ttl-zero-during-transit' => 1,
768     'ttl-zero-during-reassembly' => 1,
769     'parameter-problem' => 1,
770     'ip-header-bad' => 1,
771     'required-option-missing' => 1,
772     'timestamp-request' => 1,
773     'timestamp-reply' => 1,
774     'address-mask-request' => 1,
775     'address-mask-reply' => 1,
776 };
777
778 # ip6tables -p icmpv6 -h
779
780 my $icmpv6_type_names = {
781     'any' => 1,
782     'destination-unreachable' => 1,
783     'no-route' => 1,
784     'communication-prohibited' => 1,
785     'address-unreachable' => 1,
786     'port-unreachable' => 1,
787     'packet-too-big' => 1,
788     'time-exceeded' => 1,
789     'ttl-zero-during-transit' => 1,
790     'ttl-zero-during-reassembly' => 1,
791     'parameter-problem' => 1,
792     'bad-header' => 1,
793     'unknown-header-type' => 1,
794     'unknown-option' => 1,
795     'echo-request' => 1,
796     'echo-reply' => 1,
797     'router-solicitation' => 1,
798     'router-advertisement' => 1,
799     'neighbor-solicitation' => 1,
800     'neighbour-solicitation' => 1,
801     'neighbor-advertisement' => 1,
802     'neighbour-advertisement' => 1,
803     'redirect' => 1,
804 };
805
806 sub init_firewall_macros {
807
808     $pve_fw_parsed_macros = {};
809
810     my $parse = sub {
811         my ($k, $macro) = @_;
812         my $lc_name = lc($k);
813         $pve_fw_macro_ipversion->{$k} = 0;
814         while (!ref($macro->[0])) {
815             my $desc = shift @$macro;
816             if ($desc eq 'ipv4only') {
817                 $pve_fw_macro_ipversion->{$k} = 4;
818             } elsif ($desc eq 'ipv6only') {
819                 $pve_fw_macro_ipversion->{$k} = 6;
820             } else {
821                 $pve_fw_macro_descr->{$k} = $desc;
822             }
823         }
824         $pve_fw_preferred_macro_names->{$lc_name} = $k;
825         $pve_fw_parsed_macros->{$k} = $macro;
826     };
827
828     foreach my $k (keys %$pve_fw_macros) {
829         &$parse($k, $pve_fw_macros->{$k});
830     }
831
832     foreach my $k (keys %$pve_ipv6fw_macros) {
833         next if $pve_fw_parsed_macros->{$k};
834         &$parse($k, $pve_ipv6fw_macros->{$k});
835         $pve_fw_macro_ipversion->{$k} = 6;
836     }
837 }
838
839 init_firewall_macros();
840
841 sub get_macros {
842     return wantarray ? ($pve_fw_parsed_macros, $pve_fw_macro_descr): $pve_fw_parsed_macros;
843 }
844
845 my $etc_services;
846
847 sub get_etc_services {
848
849     return $etc_services if $etc_services;
850
851     my $filename = "/etc/services";
852
853     my $fh = IO::File->new($filename, O_RDONLY);
854     if (!$fh) {
855         warn "unable to read '$filename' - $!\n";
856         return {};
857     }
858
859     my $services = {};
860
861     while (my $line = <$fh>) {
862         chomp ($line);
863         next if $line =~m/^#/;
864         next if ($line =~m/^\s*$/);
865
866         if ($line =~ m!^(\S+)\s+(\S+)/(tcp|udp|sctp).*$!) {
867             $services->{byid}->{$2}->{name} = $1;
868             $services->{byid}->{$2}->{port} = $2;
869             $services->{byid}->{$2}->{$3} = 1;
870             $services->{byname}->{$1} = $services->{byid}->{$2};
871         }
872     }
873
874     close($fh);
875
876     $etc_services = $services;
877
878
879     return $etc_services;
880 }
881
882 sub parse_protocol_file {
883     my ($filename) = @_;
884
885     my $fh = IO::File->new($filename, O_RDONLY);
886     if (!$fh) {
887         warn "unable to read '$filename' - $!\n";
888         return {};
889     }
890
891     my $protocols = {};
892
893     while (my $line = <$fh>) {
894         chomp ($line);
895         next if $line =~m/^#/;
896         next if ($line =~m/^\s*$/);
897
898         if ($line =~ m!^(\S+)\s+(\d+)(?:\s+.*)?$!) {
899             $protocols->{byid}->{$2}->{name} = $1;
900             $protocols->{byname}->{$1} = $protocols->{byid}->{$2};
901         }
902     }
903
904     close($fh);
905
906     return $protocols;
907 }
908
909 my $etc_protocols;
910
911 sub get_etc_protocols {
912     return $etc_protocols if $etc_protocols;
913
914     my $protocols = parse_protocol_file('/etc/protocols');
915
916     # add special case for ICMP v6
917     $protocols->{byid}->{icmpv6}->{name} = "icmpv6";
918     $protocols->{byname}->{icmpv6} = $protocols->{byid}->{icmpv6};
919
920     $etc_protocols = $protocols;
921
922     return $etc_protocols;
923 }
924
925 my $etc_ethertypes;
926
927 sub get_etc_ethertypes {
928     $etc_ethertypes = parse_protocol_file('/etc/ethertypes')
929         if !$etc_ethertypes;
930     return $etc_ethertypes;
931 }
932
933 my $__local_network;
934
935 sub local_network {
936     my ($new_value) = @_;
937
938     $__local_network = $new_value if defined($new_value);
939
940     return $__local_network if defined($__local_network);
941
942     eval {
943         my $nodename = PVE::INotify::nodename();
944
945         my $ip = PVE::Cluster::remote_node_ip($nodename);
946
947         my $testip = Net::IP->new($ip);
948
949         my $isv6 = $testip->version == 6;
950         my $routes = $isv6 ? PVE::ProcFSTools::read_proc_net_ipv6_route()
951                            : PVE::ProcFSTools::read_proc_net_route();
952         foreach my $entry (@$routes) {
953             my $mask;
954             if ($isv6) {
955                 $mask = $entry->{prefix};
956                 next if !$mask; # skip the default route...
957             } else {
958                 $mask = $PVE::Network::ipv4_mask_hash_localnet->{$entry->{mask}};
959                 next if !defined($mask);
960             }
961             my $cidr = "$entry->{dest}/$mask";
962             my $testnet = Net::IP->new($cidr);
963             my $overlap = $testnet->overlaps($testip);
964             if ($overlap == $Net::IP::IP_B_IN_A_OVERLAP ||
965                 $overlap == $Net::IP::IP_IDENTICAL)
966             {
967                 $__local_network = $cidr;
968                 return;
969             }
970         }
971     };
972     warn $@ if $@;
973
974     return $__local_network;
975 }
976
977 # ipset names are limited to 31 characters,
978 # and we use '-v4' or '-v6' to indicate IP versions, 
979 # and we use '_swap' suffix for atomic update, 
980 # for example PVEFW-${VMID}-${ipset_name}_swap
981
982 my $max_iptables_ipset_name_length = 31 - length("PVEFW-") - length("_swap");
983
984 sub compute_ipset_chain_name {
985     my ($vmid, $ipset_name, $ipversion) = @_;
986
987     $vmid = 0 if !defined($vmid);
988
989     my $id = "$vmid-${ipset_name}-v$ipversion";
990
991     if (length($id) > $max_iptables_ipset_name_length) {
992         $id = PVE::Tools::fnv31a_hex($id);
993     }
994
995     return "PVEFW-$id";
996 }
997
998 sub compute_ipfilter_ipset_name {
999     my ($iface) = @_;
1000
1001     return "ipfilter-$iface";
1002 }
1003
1004 sub parse_address_list {
1005     my ($str) = @_;
1006
1007     if ($str =~ m/^(\+)(\S+)$/) { # ipset ref
1008         die "ipset name too long\n" if length($str) > ($max_ipset_name_length + 1);
1009         return;
1010     }
1011
1012     if ($str =~ m/^${ip_alias_pattern}$/) {
1013         die "alias name too long\n" if length($str) > $max_alias_name_length;
1014         return;
1015     }
1016
1017     my $count = 0;
1018     my $iprange = 0;
1019     my $ipversion;
1020
1021     my @elements = split(/,/, $str);
1022     die "extraneous commas in list\n" if $str ne join(',', @elements);
1023     foreach my $elem (@elements) {
1024         $count++;
1025         my $ip = Net::IP->new($elem);
1026         if (!$ip) {
1027             my $err = Net::IP::Error();
1028             die "invalid IP address: $err\n";
1029         }
1030         $iprange = 1 if $elem =~ m/-/;
1031
1032         my $new_ipversion = Net::IP::ip_is_ipv6($ip->ip()) ? 6 : 4;
1033
1034         die "detected mixed ipv4/ipv6 addresses in address list '$str'\n"
1035             if $ipversion && ($new_ipversion != $ipversion);
1036
1037         $ipversion = $new_ipversion;
1038     }
1039
1040     die "you can't use a range in a list\n" if $iprange && $count > 1;
1041
1042     return $ipversion;
1043 }
1044
1045 sub parse_port_name_number_or_range {
1046     my ($str, $dport) = @_;
1047
1048     my $services = PVE::Firewall::get_etc_services();
1049     my $count = 0;
1050     my $icmp_port = 0;
1051
1052     my @elements = split(/,/, $str);
1053     die "extraneous commas in list\n" if $str ne join(',', @elements);
1054     foreach my $item (@elements) {
1055         if ($item =~ m/^([0-9]+):([0-9]+)$/) {
1056             $count += 2;
1057             my ($port1, $port2) = ($1, $2);
1058             die "invalid port '$port1'\n" if $port1 > 65535;
1059             die "invalid port '$port2'\n" if $port2 > 65535;
1060             die "backwards range '$port1:$port2' not allowed, did you mean '$port2:$port1'?\n" if $port1 > $port2;
1061         } elsif ($item =~ m/^([0-9]+)$/) {
1062             $count += 1;
1063             my $port = $1;
1064             die "invalid port '$port'\n" if $port > 65535;
1065         } else {
1066             if ($dport && $icmp_type_names->{$item}) {
1067                 $icmp_port = 1;
1068             } elsif ($dport && $icmpv6_type_names->{$item}) {
1069                 $icmp_port = 1;
1070             } else {
1071                 die "invalid port '$item'\n" if !$services->{byname}->{$item};
1072             }
1073         }
1074     }
1075
1076     die "ICPM ports not allowed in port range\n" if $icmp_port && $count > 0;
1077
1078     # I really don't like to use the word number here, but it's the only thing
1079     # that makes sense in a literal way. The range 1:100 counts as 2, not as
1080     # one and not as 100...
1081     die "too many entries in port list (> 15 numbers)\n"
1082         if $count > 15;
1083
1084     return (scalar(@elements) > 1);
1085 }
1086
1087 PVE::JSONSchema::register_format('pve-fw-sport-spec', \&pve_fw_verify_sport_spec);
1088 sub pve_fw_verify_sport_spec {
1089    my ($portstr) = @_;
1090
1091    parse_port_name_number_or_range($portstr, 0);
1092
1093    return $portstr;
1094 }
1095
1096 PVE::JSONSchema::register_format('pve-fw-dport-spec', \&pve_fw_verify_dport_spec);
1097 sub pve_fw_verify_dport_spec {
1098    my ($portstr) = @_;
1099
1100    parse_port_name_number_or_range($portstr, 1);
1101
1102    return $portstr;
1103 }
1104
1105 PVE::JSONSchema::register_format('pve-fw-addr-spec', \&pve_fw_verify_addr_spec);
1106 sub pve_fw_verify_addr_spec {
1107    my ($list) = @_;
1108
1109    parse_address_list($list);
1110
1111    return $list;
1112 }
1113
1114 PVE::JSONSchema::register_format('pve-fw-protocol-spec', \&pve_fw_verify_protocol_spec);
1115 sub pve_fw_verify_protocol_spec {
1116    my ($proto) = @_;
1117
1118    my $protocols = get_etc_protocols();
1119
1120    die "unknown protocol '$proto'\n" if $proto &&
1121        !(defined($protocols->{byname}->{$proto}) ||
1122          defined($protocols->{byid}->{$proto}));
1123
1124    return $proto;
1125 }
1126
1127
1128 # helper function for API
1129
1130 sub copy_opject_with_digest {
1131     my ($object) = @_;
1132
1133     my $sha = Digest::SHA->new('sha1');
1134
1135     my $res = {};
1136     foreach my $k (sort keys %$object) {
1137         my $v = $object->{$k};
1138         next if !defined($v);
1139         $res->{$k} = $v;
1140         $sha->add($k, ':', $v, "\n");
1141     }
1142
1143     my $digest = $sha->hexdigest;
1144
1145     $res->{digest} = $digest;
1146
1147     return wantarray ? ($res, $digest) : $res;
1148 }
1149
1150 sub copy_list_with_digest {
1151     my ($list) = @_;
1152
1153     my $sha = Digest::SHA->new('sha1');
1154
1155     my $res = [];
1156     foreach my $entry (@$list) {
1157         my $data = {};
1158         foreach my $k (sort keys %$entry) {
1159             my $v = $entry->{$k};
1160             next if !defined($v);
1161             $data->{$k} = $v;
1162             # Note: digest ignores refs ($rule->{errors})
1163             # since Digest::SHA expects a series of bytes,
1164             #  we have to encode the value here to prevent errors when
1165             #  using utf8 characters (eg. in comments)
1166             $sha->add($k, ':', encode_utf8($v), "\n") if !ref($v); ;
1167         }
1168         push @$res, $data;
1169     }
1170
1171     my $digest = $sha->hexdigest;
1172
1173     foreach my $entry (@$res) {
1174         $entry->{digest} = $digest;
1175     }
1176
1177     return wantarray ? ($res, $digest) : $res;
1178 }
1179
1180 our $cluster_option_properties = {
1181     enable => {
1182         description => "Enable or disable the firewall cluster wide.",
1183         type => 'integer',
1184         minimum => 0,
1185         optional => 1,
1186     },
1187     ebtables => {
1188         description => "Enable ebtables rules cluster wide.",
1189         type => 'boolean',
1190         default => 1,
1191         optional => 1,
1192     },
1193     policy_in => {
1194         description => "Input policy.",
1195         type => 'string',
1196         optional => 1,
1197         enum => ['ACCEPT', 'REJECT', 'DROP'],
1198     },
1199     policy_out => {
1200         description => "Output policy.",
1201         type => 'string',
1202         optional => 1,
1203         enum => ['ACCEPT', 'REJECT', 'DROP'],
1204     },
1205     log_ratelimit => {
1206         description => "Log ratelimiting settings",
1207         type => 'string', format => {
1208             enable => {
1209                 default_key => 1,
1210                 description => 'Enable or disable log rate limiting',
1211                 type => 'boolean',
1212                 default => '1',
1213             },
1214             rate => {
1215                 type => 'string',
1216                 description => 'Frequency with which the burst bucket gets refilled',
1217                 optional => 1,
1218                 pattern => '[1-9][0-9]*\/(second|minute|hour|day)',
1219                 format_description => 'rate',
1220                 default => '1/second',
1221             },
1222             burst => {
1223                 type => 'integer',
1224                 minimum => 0,
1225                 optional => 1,
1226                 description => 'Inital burst of packages which will get logged',
1227                 default => 5,
1228             },
1229         },
1230         optional => 1,
1231     },
1232 };
1233
1234 our $host_option_properties = {
1235     enable => {
1236         description => "Enable host firewall rules.",
1237         type => 'boolean',
1238         optional => 1,
1239     },
1240     log_level_in =>  get_standard_option('pve-fw-loglevel', {
1241         description => "Log level for incoming traffic." }),
1242     log_level_out =>  get_standard_option('pve-fw-loglevel', {
1243         description => "Log level for outgoing traffic." }),
1244     tcp_flags_log_level =>  get_standard_option('pve-fw-loglevel', {
1245         description => "Log level for illegal tcp flags filter." }),
1246     smurf_log_level =>  get_standard_option('pve-fw-loglevel', {
1247         description => "Log level for SMURFS filter." }),
1248     nosmurfs => {
1249         description => "Enable SMURFS filter.",
1250         type => 'boolean',
1251         optional => 1,
1252     },
1253     tcpflags => {
1254         description => "Filter illegal combinations of TCP flags.",
1255         type => 'boolean',
1256         optional => 1,
1257     },
1258     nf_conntrack_max => {
1259         description => "Maximum number of tracked connections.",
1260         type => 'integer',
1261         optional => 1,
1262         minimum => 32768,
1263     },
1264     nf_conntrack_tcp_timeout_established => {
1265         description => "Conntrack established timeout.",
1266         type => 'integer',
1267         optional => 1,
1268         minimum => 7875,
1269     },
1270     ndp => {
1271         description => "Enable NDP.",
1272         type => 'boolean',
1273         optional => 1,
1274     },
1275     nf_conntrack_allow_invalid => {
1276         description => "Allow invalid packets on connection tracking.",
1277         type => 'boolean',
1278         default => 0,
1279         optional => 1,
1280     },
1281     log_nf_conntrack => {
1282         description => "Enable logging of conntrack information.",
1283         type => 'boolean',
1284         default => 0,
1285         optional => 1
1286     },
1287 };
1288
1289 our $vm_option_properties = {
1290     enable => {
1291         description => "Enable/disable firewall rules.",
1292         type => 'boolean',
1293         optional => 1,
1294     },
1295     macfilter => {
1296         description => "Enable/disable MAC address filter.",
1297         type => 'boolean',
1298         optional => 1,
1299     },
1300     dhcp => {
1301         description => "Enable DHCP.",
1302         type => 'boolean',
1303         optional => 1,
1304     },
1305     ndp => {
1306         description => "Enable NDP.",
1307         type => 'boolean',
1308         optional => 1,
1309     },
1310     radv => {
1311         description => "Allow sending Router Advertisement.",
1312         type => 'boolean',
1313         optional => 1,
1314     },
1315     ipfilter => {
1316         description => "Enable default IP filters. " .
1317            "This is equivalent to adding an empty ipfilter-net<id> ipset " .
1318            "for every interface. Such ipsets implicitly contain sane default " .
1319            "restrictions such as restricting IPv6 link local addresses to " .
1320            "the one derived from the interface's MAC address. For containers " .
1321            "the configured IP addresses will be implicitly added.",
1322         type => 'boolean',
1323         optional => 1,
1324     },
1325     policy_in => {
1326         description => "Input policy.",
1327         type => 'string',
1328         optional => 1,
1329         enum => ['ACCEPT', 'REJECT', 'DROP'],
1330     },
1331     policy_out => {
1332         description => "Output policy.",
1333         type => 'string',
1334         optional => 1,
1335         enum => ['ACCEPT', 'REJECT', 'DROP'],
1336     },
1337     log_level_in =>  get_standard_option('pve-fw-loglevel', {
1338         description => "Log level for incoming traffic." }),
1339     log_level_out =>  get_standard_option('pve-fw-loglevel', {
1340         description => "Log level for outgoing traffic." }),
1341
1342 };
1343
1344
1345 my $addr_list_descr = "This can refer to a single IP address, an IP set ('+ipsetname') or an IP alias definition. You can also specify an address range like '20.34.101.207-201.3.9.99', or a list of IP addresses and networks (entries are separated by comma). Please do not mix IPv4 and IPv6 addresses inside such lists.";
1346
1347 my $port_descr = "You can use service names or simple numbers (0-65535), as defined in '/etc/services'. Port ranges can be specified with '\\d+:\\d+', for example '80:85', and you can use comma separated list to match several ports or ranges.";
1348
1349 my $rule_properties = {
1350     pos => {
1351         description => "Update rule at position <pos>.",
1352         type => 'integer',
1353         minimum => 0,
1354         optional => 1,
1355     },
1356     digest => get_standard_option('pve-config-digest'),
1357     type => {
1358         description => "Rule type.",
1359         type => 'string',
1360         optional => 1,
1361         enum => ['in', 'out', 'group'],
1362     },
1363     action => {
1364         description => "Rule action ('ACCEPT', 'DROP', 'REJECT') or security group name.",
1365         type => 'string',
1366         optional => 1,
1367         pattern => $security_group_name_pattern,
1368         maxLength => 20,
1369         minLength => 2,
1370     },
1371     macro => {
1372         description => "Use predefined standard macro.",
1373         type => 'string',
1374         optional => 1,
1375         maxLength => 128,
1376     },
1377     iface => get_standard_option('pve-iface', {
1378         description => "Network interface name. You have to use network configuration key names for VMs and containers ('net\\d+'). Host related rules can use arbitrary strings.",
1379         optional => 1
1380     }),
1381     source => {
1382         description => "Restrict packet source address. $addr_list_descr",
1383         type => 'string', format => 'pve-fw-addr-spec',
1384         optional => 1,
1385     },
1386     dest => {
1387         description => "Restrict packet destination address. $addr_list_descr",
1388         type => 'string', format => 'pve-fw-addr-spec',
1389         optional => 1,
1390     },
1391     proto => {
1392         description => "IP protocol. You can use protocol names ('tcp'/'udp') or simple numbers, as defined in '/etc/protocols'.",
1393         type => 'string', format => 'pve-fw-protocol-spec',
1394         optional => 1,
1395     },
1396     enable => {
1397         description => "Flag to enable/disable a rule.",
1398         type => 'integer',
1399         minimum => 0,
1400         optional => 1,
1401     },
1402     log => get_standard_option('pve-fw-loglevel', {
1403         description => "Log level for firewall rule.",
1404     }),
1405     sport => {
1406         description => "Restrict TCP/UDP source port. $port_descr",
1407         type => 'string', format => 'pve-fw-sport-spec',
1408         optional => 1,
1409     },
1410     dport => {
1411         description => "Restrict TCP/UDP destination port. $port_descr",
1412         type => 'string', format => 'pve-fw-dport-spec',
1413         optional => 1,
1414     },
1415     comment => {
1416         description => "Descriptive comment.",
1417         type => 'string',
1418         optional => 1,
1419     },
1420 };
1421
1422 sub add_rule_properties {
1423     my ($properties) = @_;
1424
1425     foreach my $k (keys %$rule_properties) {
1426         my $h = $rule_properties->{$k};
1427         # copy data, so that we can modify later without side effects
1428         foreach my $opt (keys %$h) { $properties->{$k}->{$opt} = $h->{$opt}; }
1429     }
1430
1431     return $properties;
1432 }
1433
1434 sub delete_rule_properties {
1435     my ($rule, $delete_str) = @_;
1436
1437     foreach my $opt (PVE::Tools::split_list($delete_str)) {
1438         raise_param_exc({ 'delete' => "no such property ('$opt')"})
1439             if !defined($rule_properties->{$opt});
1440         raise_param_exc({ 'delete' => "unable to delete required property '$opt'"})
1441             if $opt eq 'type' || $opt eq 'action';
1442         delete $rule->{$opt};
1443     }
1444
1445     return $rule;
1446 }
1447
1448 my $apply_macro = sub {
1449     my ($macro_name, $param, $verify, $ipversion) = @_;
1450
1451     my $macro_rules = $pve_fw_parsed_macros->{$macro_name};
1452     die "unknown macro '$macro_name'\n" if !$macro_rules; # should not happen
1453
1454     if ($ipversion && ($ipversion == 6) && $pve_ipv6fw_macros->{$macro_name}) {
1455         $macro_rules = $pve_ipv6fw_macros->{$macro_name};
1456     }
1457
1458     # skip macros which are specific to another ipversion
1459     if ($ipversion && (my $required = $pve_fw_macro_ipversion->{$macro_name})) {
1460         return if $ipversion != $required;
1461     }
1462
1463     my $rules = [];
1464
1465     foreach my $templ (@$macro_rules) {
1466         my $rule = {};
1467         my $param_used = {};
1468         foreach my $k (keys %$templ) {
1469             my $v = $templ->{$k};
1470             if ($v eq 'PARAM') {
1471                 $v = $param->{$k};
1472                 $param_used->{$k} = 1;
1473             } elsif ($v eq 'DEST') {
1474                 $v = $param->{dest};
1475                 $param_used->{dest} = 1;
1476             } elsif ($v eq 'SOURCE') {
1477                 $v = $param->{source};
1478                 $param_used->{source} = 1;
1479             }
1480
1481             if (!defined($v)) {
1482                 my $msg = "missing parameter '$k' in macro '$macro_name'";
1483                 raise_param_exc({ macro => $msg }) if $verify;
1484                 die "$msg\n";
1485             }
1486             $rule->{$k} = $v;
1487         }
1488         foreach my $k (keys %$param) {
1489             next if $k eq 'macro';
1490             next if !defined($param->{$k});
1491             next if $param_used->{$k};
1492             if (defined($rule->{$k})) {
1493                 if ($rule->{$k} ne $param->{$k}) {
1494                     my $msg = "parameter '$k' already define in macro (value = '$rule->{$k}')";
1495                     raise_param_exc({ $k => $msg }) if $verify;
1496                     die "$msg\n";
1497                 }
1498             } else {
1499                 $rule->{$k} = $param->{$k};
1500             }
1501         }
1502         push @$rules, $rule;
1503     }
1504
1505     return $rules;
1506 };
1507
1508 my $rule_env_iface_lookup = {
1509     'ct' => 1,
1510     'vm' => 1,
1511     'group' => 0,
1512     'cluster' => 1,
1513     'host' => 1,
1514 };
1515
1516 sub verify_rule {
1517     my ($rule, $cluster_conf, $fw_conf, $rule_env, $noerr) = @_;
1518
1519     my $allow_groups = $rule_env eq 'group' ? 0 : 1;
1520
1521     my $allow_iface = $rule_env_iface_lookup->{$rule_env};
1522     die "unknown rule_env '$rule_env'\n" if !defined($allow_iface); # should not happen
1523
1524     my $errors = $rule->{errors} || {};
1525
1526     my $error_count = 0;
1527
1528     my $add_error = sub {
1529         my ($param, $msg)  = @_;
1530         chomp $msg;
1531         raise_param_exc({ $param => $msg }) if !$noerr;
1532         $error_count++;
1533         $errors->{$param} = $msg if !$errors->{$param};
1534     };
1535
1536     my $ipversion;
1537     my $set_ip_version = sub {
1538         my $vers = shift;
1539         if ($vers) {
1540             die "detected mixed ipv4/ipv6 adresses in rule\n"
1541                 if $ipversion && ($vers != $ipversion);
1542             $ipversion = $vers;
1543         }
1544     };
1545
1546     my $check_ipset_or_alias_property = sub {
1547         my ($name, $expected_ipversion) = @_;
1548
1549         if (my $value = $rule->{$name}) {
1550             if ($value =~ m/^\+/) {
1551                 if ($value =~ m/^\+(${ipset_name_pattern})$/) {
1552                     &$add_error($name, "no such ipset '$1'")
1553                         if !($cluster_conf->{ipset}->{$1} || ($fw_conf && $fw_conf->{ipset}->{$1}));
1554
1555                 } else {
1556                     &$add_error($name, "invalid ipset name '$value'");
1557                 }
1558             } elsif ($value =~ m/^${ip_alias_pattern}$/){
1559                 my $alias = lc($value);
1560                 &$add_error($name, "no such alias '$value'")
1561                     if !($cluster_conf->{aliases}->{$alias} || ($fw_conf && $fw_conf->{aliases}->{$alias}));
1562                 my $e = $fw_conf ? $fw_conf->{aliases}->{$alias} : undef;
1563                 $e = $cluster_conf->{aliases}->{$alias} if !$e && $cluster_conf;
1564
1565                 &$set_ip_version($e->{ipversion});
1566             }
1567         }
1568     };
1569
1570     my $type = $rule->{type};
1571     my $action = $rule->{action};
1572
1573     &$add_error('type', "missing property") if !$type;
1574     &$add_error('action', "missing property") if !$action;
1575
1576     if ($type) {
1577         if ($type eq  'in' || $type eq 'out') {
1578             &$add_error('action', "unknown action '$action'")
1579                 if $action && ($action !~ m/^(ACCEPT|DROP|REJECT)$/);
1580         } elsif ($type eq 'group') {
1581             &$add_error('type', "security groups not allowed")
1582                 if !$allow_groups;
1583             &$add_error('action', "invalid characters in security group name")
1584                 if $action && ($action !~ m/^${security_group_name_pattern}$/);
1585         } else {
1586             &$add_error('type', "unknown rule type '$type'");
1587         }
1588     }
1589
1590     if ($rule->{iface}) {
1591         &$add_error('type', "parameter -i not allowed for this rule type")
1592             if !$allow_iface;
1593         eval { PVE::JSONSchema::pve_verify_iface($rule->{iface}); };
1594         &$add_error('iface', $@) if $@;
1595         if ($rule_env eq 'vm' || $rule_env eq 'ct') {
1596             &$add_error('iface', "value does not match the regex pattern 'net\\d+'")
1597                 if $rule->{iface} !~  m/^net(\d+)$/;
1598         }
1599     }
1600
1601     if ($rule->{macro}) {
1602         if (my $preferred_name = $pve_fw_preferred_macro_names->{lc($rule->{macro})}) {
1603             $rule->{macro} = $preferred_name;
1604         } else {
1605             &$add_error('macro', "unknown macro '$rule->{macro}'");
1606         }
1607     }
1608
1609     if ($rule->{proto}) {
1610         eval { pve_fw_verify_protocol_spec($rule->{proto}); };
1611         &$add_error('proto', $@) if $@;
1612         &$set_ip_version(4) if $rule->{proto} eq 'icmp';
1613         &$set_ip_version(6) if $rule->{proto} eq 'icmpv6';
1614     }
1615
1616     if ($rule->{dport}) {
1617         eval { parse_port_name_number_or_range($rule->{dport}, 1); };
1618         &$add_error('dport', $@) if $@;
1619         my $proto = $rule->{proto};
1620         &$add_error('proto', "missing property - 'dport' requires this property")
1621             if !$proto;
1622         &$add_error('dport', "protocol '$proto' does not support ports")
1623             if !$PROTOCOLS_WITH_PORTS->{$proto} &&
1624                 $proto ne 'icmp' && $proto ne 'icmpv6'; # special cases
1625     }
1626
1627     if ($rule->{sport}) {
1628         eval { parse_port_name_number_or_range($rule->{sport}, 0); };
1629         &$add_error('sport', $@) if $@;
1630         my $proto = $rule->{proto};
1631         &$add_error('proto', "missing property - 'sport' requires this property")
1632             if !$proto;
1633         &$add_error('sport', "protocol '$proto' does not support ports")
1634             if !$PROTOCOLS_WITH_PORTS->{$proto};
1635     }
1636
1637     if ($rule->{source}) {
1638         eval { 
1639             my $source_ipversion = parse_address_list($rule->{source});
1640             &$set_ip_version($source_ipversion);
1641         };
1642         &$add_error('source', $@) if $@;
1643         &$check_ipset_or_alias_property('source', $ipversion);
1644     }
1645
1646     if ($rule->{dest}) {
1647         eval { 
1648             my $dest_ipversion = parse_address_list($rule->{dest}); 
1649             &$set_ip_version($dest_ipversion);
1650         };
1651         &$add_error('dest', $@) if $@;
1652         &$check_ipset_or_alias_property('dest', $ipversion);
1653     }
1654
1655     $rule->{ipversion} = $ipversion if $ipversion;
1656
1657     if ($rule->{macro} && !$error_count) {
1658         eval { &$apply_macro($rule->{macro}, $rule, 1, $ipversion); };
1659         if (my $err = $@) {
1660             if (ref($err) eq "PVE::Exception" && $err->{errors}) {
1661                 my $eh = $err->{errors};
1662                 foreach my $p (keys %$eh) {
1663                     &$add_error($p, $eh->{$p});
1664                 }
1665             } else {
1666                 &$add_error('macro', "$err");
1667             }
1668         }
1669     }
1670
1671     $rule->{errors} = $errors if $error_count;
1672
1673     return $rule;
1674 }
1675
1676 sub copy_rule_data {
1677     my ($rule, $param) = @_;
1678
1679     foreach my $k (keys %$rule_properties) {
1680         if (defined(my $v = $param->{$k})) {
1681             if ($v eq '' || $v eq '-') {
1682                 delete $rule->{$k};
1683             } else {
1684                 $rule->{$k} = $v;
1685             }
1686         }
1687     }
1688
1689     return $rule;
1690 }
1691
1692 sub rules_modify_permissions {
1693     my ($rule_env) = @_;
1694
1695     if ($rule_env eq 'host') {
1696         return {
1697             check => ['perm', '/nodes/{node}', [ 'Sys.Modify' ]],
1698         };
1699     } elsif ($rule_env eq 'cluster' || $rule_env eq 'group') {
1700         return {
1701             check => ['perm', '/', [ 'Sys.Modify' ]],
1702         };
1703     } elsif ($rule_env eq 'vm' || $rule_env eq 'ct') {
1704         return {
1705             check => ['perm', '/vms/{vmid}', [ 'VM.Config.Network' ]],
1706         }
1707     }
1708
1709     return undef;
1710 }
1711
1712 sub rules_audit_permissions {
1713     my ($rule_env) = @_;
1714
1715     if ($rule_env eq 'host') {
1716         return {
1717             check => ['perm', '/nodes/{node}', [ 'Sys.Audit' ]],
1718         };
1719     } elsif ($rule_env eq 'cluster' || $rule_env eq 'group') {
1720         return {
1721             check => ['perm', '/', [ 'Sys.Audit' ]],
1722         };
1723     } elsif ($rule_env eq 'vm' || $rule_env eq 'ct') {
1724         return {
1725             check => ['perm', '/vms/{vmid}', [ 'VM.Audit' ]],
1726         }
1727     }
1728
1729     return undef;
1730 }
1731
1732 # core functions
1733 my $bridge_firewall_enabled = 0;
1734
1735 sub enable_bridge_firewall {
1736
1737     return if $bridge_firewall_enabled; # only once
1738
1739     PVE::ProcFSTools::write_proc_entry("/proc/sys/net/bridge/bridge-nf-call-iptables", "1");
1740     PVE::ProcFSTools::write_proc_entry("/proc/sys/net/bridge/bridge-nf-call-ip6tables", "1");
1741
1742     # make sure syncookies are enabled (which is default on newer 3.X kernels anyways)
1743     PVE::ProcFSTools::write_proc_entry("/proc/sys/net/ipv4/tcp_syncookies", "1");
1744
1745     $bridge_firewall_enabled = 1;
1746 }
1747
1748 sub iptables_restore_cmdlist {
1749     my ($cmdlist) = @_;
1750
1751     run_command("/sbin/iptables-restore -n", input => $cmdlist, errmsg => "iptables_restore_cmdlist");
1752 }
1753
1754 sub ip6tables_restore_cmdlist {
1755     my ($cmdlist) = @_;
1756
1757     run_command("/sbin/ip6tables-restore -n", input => $cmdlist, errmsg => "iptables_restore_cmdlist");
1758 }
1759
1760 sub ipset_restore_cmdlist {
1761     my ($cmdlist) = @_;
1762
1763     run_command("/sbin/ipset restore", input => $cmdlist, errmsg => "ipset_restore_cmdlist");
1764 }
1765
1766 sub ebtables_restore_cmdlist {
1767     my ($cmdlist) = @_;
1768
1769     run_command("/sbin/ebtables-restore", input => $cmdlist, errmsg => "ebtables_restore_cmdlist");
1770 }
1771
1772 sub iptables_get_chains {
1773     my ($iptablescmd) = @_;
1774
1775     $iptablescmd = "iptables" if !$iptablescmd;
1776
1777     my $res = {};
1778
1779     # check what chains we want to track
1780     my $is_pvefw_chain = sub {
1781         my $name = shift;
1782
1783         return 1 if $name =~ m/^PVEFW-\S+$/;
1784
1785         return 1 if $name =~ m/^tap\d+i\d+-(?:IN|OUT)$/;
1786
1787         return 1 if $name =~ m/^veth\d+i\d+-(?:IN|OUT)$/;
1788
1789         return 1 if $name =~ m/^fwbr\d+(v\d+)?-(?:FW|IN|OUT|IPS)$/;
1790         return 1 if $name =~ m/^GROUP-(?:$security_group_name_pattern)-(?:IN|OUT)$/;
1791
1792         return undef;
1793     };
1794
1795     my $table = '';
1796
1797     my $hooks = {};
1798
1799     my $parser = sub {
1800         my $line = shift;
1801
1802         return if $line =~ m/^#/;
1803         return if $line =~ m/^\s*$/;
1804
1805         if ($line =~ m/^\*(\S+)$/) {
1806             $table = $1;
1807             return;
1808         }
1809
1810         return if $table ne 'filter';
1811
1812         if ($line =~ m/^:(\S+)\s/) {
1813             my $chain = $1;
1814             return if !&$is_pvefw_chain($chain);
1815             $res->{$chain} = "unknown";
1816         } elsif ($line =~ m/^-A\s+(\S+)\s.*--comment\s+\"PVESIG:(\S+)\"/) {
1817             my ($chain, $sig) = ($1, $2);
1818             return if !&$is_pvefw_chain($chain);
1819             $res->{$chain} = $sig;
1820         } elsif ($line =~ m/^-A\s+(INPUT|OUTPUT|FORWARD)\s+-j\s+PVEFW-\1$/) {
1821             $hooks->{$1} = 1;
1822         } else {
1823             # simply ignore the rest
1824             return;
1825         }
1826     };
1827
1828     run_command("/sbin/$iptablescmd-save", outfunc => $parser);
1829
1830     return wantarray ? ($res, $hooks) : $res;
1831 }
1832
1833 sub iptables_chain_digest {
1834     my ($rules) = @_;
1835     my $digest = Digest::SHA->new('sha1');
1836     foreach my $rule (@$rules) { # order is important
1837         $digest->add($rule);
1838     }
1839     return $digest->b64digest;
1840 }
1841
1842 sub ipset_chain_digest {
1843     my ($rules) = @_;
1844
1845     my $digest = Digest::SHA->new('sha1');
1846     foreach my $rule (sort @$rules) { # note: sorted
1847         $digest->add($rule);
1848     }
1849     return $digest->b64digest;
1850 }
1851
1852 sub ipset_get_chains {
1853
1854     my $res = {};
1855     my $chains = {};
1856
1857     my $parser = sub {
1858         my $line = shift;
1859
1860         return if $line =~ m/^#/;
1861         return if $line =~ m/^\s*$/;
1862         if ($line =~ m/^(?:\S+)\s(PVEFW-\S+)\s(?:\S+).*/) {
1863             my $chain = $1;
1864             $line =~ s/\s+$//; # delete trailing white space
1865             push @{$chains->{$chain}}, $line;
1866         } else {
1867             # simply ignore the rest
1868             return;
1869         }
1870     };
1871
1872     run_command("/sbin/ipset save", outfunc => $parser);
1873
1874     # compute digest for each chain
1875     foreach my $chain (keys %$chains) {
1876         $res->{$chain} = ipset_chain_digest($chains->{$chain});
1877     }
1878
1879     return $res;
1880 }
1881
1882 sub ebtables_get_chains {
1883
1884     my $res = {};
1885     my $chains = {};
1886     my $parser = sub {
1887         my $line = shift;
1888         return if $line =~ m/^#/;
1889         return if $line =~ m/^\s*$/;
1890         if ($line =~ m/^:(\S+)\s\S+$/) {
1891             # Make sure we know chains exist even if they're empty.
1892             $chains->{$1} //= [];
1893         } elsif ($line =~ m/^(?:\S+)\s(\S+)\s(?:\S+).*/) {
1894             my $chain = $1;
1895             $line =~ s/\s+$//;
1896             push @{$chains->{$chain}}, $line;
1897         } else {
1898             # simply ignore the rest
1899             return;
1900         }
1901     };
1902
1903     run_command("/sbin/ebtables-save", outfunc => $parser);
1904     # compute digest for each chain and store rules as well
1905     foreach my $chain (keys %$chains) {
1906         $res->{$chain}->{rules} = $chains->{$chain};
1907         $res->{$chain}->{sig} = iptables_chain_digest($chains->{$chain});
1908     }
1909     return $res;
1910 }
1911
1912 # substitude action of rule according to action hash
1913 sub rule_substitude_action {
1914     my ($rule, $actions) = @_;
1915
1916     if (my $action = $rule->{action}) {
1917         $rule->{action} = $actions->{$action} if defined($actions->{$action});
1918     }
1919 }
1920
1921 # generate a src or dst match
1922 # $dir(ection) is either d or s
1923 sub ipt_gen_src_or_dst_match {
1924     my ($adr, $dir, $ipversion, $cluster_conf, $fw_conf) = @_;
1925
1926     my $srcdst;
1927     if ($dir eq 's') {
1928         $srcdst = "src";
1929     } elsif ($dir eq 'd') {
1930         $srcdst = "dst";
1931     } else {
1932         die "ipt_gen_src_or_dst_match: invalid direction $dir \n";
1933     }
1934
1935     my $match;
1936     if ($adr =~ m/^\+/) {
1937         if ($adr =~ m/^\+(${ipset_name_pattern})$/) {
1938             my $name = $1;
1939             my $ipset_chain;
1940             if ($fw_conf && $fw_conf->{ipset}->{$name}) {
1941                 $ipset_chain = compute_ipset_chain_name($fw_conf->{vmid}, $name, $ipversion);
1942             } elsif ($cluster_conf && $cluster_conf->{ipset}->{$name}) {
1943                 $ipset_chain = compute_ipset_chain_name(0, $name, $ipversion);
1944             } else {
1945                 die "no such ipset '$name'\n";
1946             }
1947             $match = "-m set --match-set ${ipset_chain} ${srcdst}";
1948         } else {
1949             die "invalid security group name '$adr'\n";
1950         }
1951     } elsif ($adr =~ m/^${ip_alias_pattern}$/){
1952         my $alias = lc($adr);
1953         my $e = $fw_conf ? $fw_conf->{aliases}->{$alias} : undef;
1954         $e = $cluster_conf->{aliases}->{$alias} if !$e && $cluster_conf;
1955         die "no such alias '$adr'\n" if !$e;
1956         $match = "-${dir} $e->{cidr}";
1957     } elsif ($adr =~ m/\-/){
1958         $match = "-m iprange --${srcdst}-range $adr";
1959     } else {
1960         $match = "-${dir} $adr";
1961     }
1962
1963     return $match;
1964 }
1965
1966 # convert a %rule to an array of iptables commands
1967 sub ipt_rule_to_cmds {
1968     my ($rule, $chain, $ipversion, $cluster_conf, $fw_conf, $vmid) = @_;
1969
1970     die "ipt_rule_to_cmds unable to handle macro" if $rule->{macro}; #should not happen
1971
1972     my @match = ();
1973
1974     if (defined $rule->{match}) {
1975         push @match, $rule->{match};
1976     } else {
1977         push @match, "-i $rule->{iface_in}" if $rule->{iface_in};
1978         push @match, "-o $rule->{iface_out}" if $rule->{iface_out};
1979
1980         if ($rule->{source}) {
1981             push @match, ipt_gen_src_or_dst_match($rule->{source}, 's', $ipversion, $cluster_conf, $fw_conf);
1982         }
1983         if ($rule->{dest}) {
1984             push @match, ipt_gen_src_or_dst_match($rule->{dest}, 'd', $ipversion, $cluster_conf, $fw_conf);
1985         }
1986
1987         if (my $proto = $rule->{proto}) {
1988             push @match, "-p $proto";
1989
1990             my $multidport = defined($rule->{dport}) && parse_port_name_number_or_range($rule->{dport}, 1);
1991             my $multisport = defined($rule->{sport}) && parse_port_name_number_or_range($rule->{sport}, 0);
1992
1993             my $add_dport = sub {
1994                 return if !$rule->{dport};
1995
1996                 if ($proto eq 'icmp') {
1997                     # Note: we use dport to store --icmp-type
1998                     die "unknown icmp-type '$rule->{dport}'\n"
1999                         if $rule->{dport} !~ /^\d+$/ && !defined($icmp_type_names->{$rule->{dport}});
2000                     push @match, "-m icmp --icmp-type $rule->{dport}";
2001                 } elsif ($proto eq 'icmpv6') {
2002                     # Note: we use dport to store --icmpv6-type
2003                     die "unknown icmpv6-type '$rule->{dport}'\n"
2004                         if $rule->{dport} !~ /^\d+$/ && !defined($icmpv6_type_names->{$rule->{dport}});
2005                     push @match, "-m icmpv6 --icmpv6-type $rule->{dport}";
2006                 } elsif (!$PROTOCOLS_WITH_PORTS->{$proto}) {
2007                     die "protocol $proto does not have ports\n";
2008                 } elsif ($multidport) {
2009                     push @match, "--match multiport", "--dports $rule->{dport}";
2010                 } else {
2011                     push @match, "--dport $rule->{dport}";
2012                 }
2013             };
2014
2015             my $add_sport = sub {
2016                 return if !$rule->{sport};
2017
2018                 die "protocol $proto does not have ports\n"
2019                     if !$PROTOCOLS_WITH_PORTS->{$proto};
2020                 if ($multisport) {
2021                     push @match, "--match multiport", "--sports $rule->{sport}";
2022                 } else {
2023                     push @match, "--sport $rule->{sport}";
2024                 }
2025             };
2026
2027             # order matters - single port before multiport!
2028             $add_dport->() if $multisport;
2029             $add_sport->();
2030             $add_dport->() if !$multisport;
2031         } elsif ($rule->{dport} || $rule->{sport}) {
2032             die "destination port '$rule->{dport}', but no protocol specified\n" if $rule->{dport};
2033             die "source port '$rule->{sport}', but no protocol specified\n" if $rule->{sport};
2034         }
2035
2036         push @match, "-m addrtype --dst-type $rule->{dsttype}" if $rule->{dsttype};
2037     }
2038     my $matchstr = scalar(@match) ? join(' ', @match) : "";
2039
2040     my $targetstr;
2041     if (defined $rule->{target}) {
2042         $targetstr = $rule->{target};
2043     } else {
2044         my $action = (defined $rule->{action}) ? $rule->{action} : "";
2045         my $goto = 1 if $action eq 'PVEFW-SET-ACCEPT-MARK';
2046         $targetstr = ($goto) ? "-g $action" : "-j $action";
2047     }
2048
2049     my @iptcmds;
2050     my $log = $rule->{log};
2051     if (defined($log) && $log ne 'nolog') {
2052         my $loglevel = $log_level_hash->{$log};
2053         my $logaction = get_log_rule_base($chain, $vmid, $rule->{logmsg}, $loglevel);
2054         push @iptcmds, "-A $chain $matchstr $logaction";
2055     }
2056     push @iptcmds, "-A $chain $matchstr $targetstr";
2057     return @iptcmds;
2058 }
2059
2060 sub ruleset_generate_rule {
2061     my ($ruleset, $chain, $ipversion, $rule, $cluster_conf, $fw_conf, $vmid) = @_;
2062
2063     my $rules;
2064
2065     if ($rule->{macro}) {
2066         $rules = &$apply_macro($rule->{macro}, $rule, 0, $ipversion);
2067     } else {
2068         $rules = [ $rule ];
2069     }
2070
2071     # update all or nothing
2072     my @ipt_rule_cmds;
2073     foreach my $r (@$rules) {
2074         push @ipt_rule_cmds, ipt_rule_to_cmds($r, $chain, $ipversion, $cluster_conf, $fw_conf, $vmid);
2075     }
2076     foreach my $c (@ipt_rule_cmds) {
2077         ruleset_add_ipt_cmd($ruleset, $chain, $c);
2078     }
2079 }
2080
2081 sub ruleset_create_chain {
2082     my ($ruleset, $chain) = @_;
2083
2084     die "Invalid chain name '$chain' (28 char max)\n" if length($chain) > 28;
2085     die "chain name may not contain collons\n" if $chain =~ m/:/; # because of log format
2086
2087     die "chain '$chain' already exists\n" if $ruleset->{$chain};
2088
2089     $ruleset->{$chain} = [];
2090 }
2091
2092 sub ruleset_chain_exist {
2093     my ($ruleset, $chain) = @_;
2094
2095     return $ruleset->{$chain} ? 1 : undef;
2096 }
2097
2098 # add an iptables command (like generated by ipt_rule_to_cmds) to a chain
2099 sub ruleset_add_ipt_cmd {
2100    my ($ruleset, $chain, $iptcmd) = @_;
2101
2102    die "no such chain '$chain'\n" if !$ruleset->{$chain};
2103
2104    push @{$ruleset->{$chain}}, $iptcmd;
2105 }
2106
2107 sub ruleset_addrule {
2108     my ($ruleset, $chain, $match, $action, $log, $logmsg, $vmid) = @_;
2109
2110     die "no such chain '$chain'\n" if !$ruleset->{$chain};
2111
2112     if ($log) {
2113         my $loglevel = $log_level_hash->{$log};
2114         my $logaction = get_log_rule_base($chain, $vmid, $logmsg, $loglevel);
2115         push @{$ruleset->{$chain}}, "-A $chain $match $logaction";
2116     }
2117     # for stable ebtables digests avoid double-spaces to match ebtables-save output
2118     $match .= ' ' if length($match);
2119     push @{$ruleset->{$chain}}, "-A $chain ${match}$action";
2120 }
2121
2122 sub ruleset_insertrule {
2123    my ($ruleset, $chain, $match, $action, $log) = @_;
2124
2125    die "no such chain '$chain'\n" if !$ruleset->{$chain};
2126
2127    unshift @{$ruleset->{$chain}}, "-A $chain $match $action";
2128 }
2129
2130 sub get_log_rule_base {
2131     my ($chain, $vmid, $msg, $loglevel) = @_;
2132
2133     $vmid = 0 if !defined($vmid);
2134     $msg = "" if !defined($msg);
2135
2136     my $rlimit = '';
2137     if (defined($global_log_ratelimit)) {
2138         $rlimit = "-m limit $global_log_ratelimit ";
2139     }
2140
2141     # Note: we use special format for prefix to pass further
2142     # info to log daemon (VMID, LOGLEVEL and CHAIN)
2143     return "${rlimit}-j NFLOG --nflog-prefix \":$vmid:$loglevel:$chain: $msg\"";
2144 }
2145
2146 sub ruleset_add_chain_policy {
2147     my ($ruleset, $chain, $ipversion, $vmid, $policy, $loglevel, $accept_action) = @_;
2148
2149     if ($policy eq 'ACCEPT') {
2150
2151         my $rule = { action => 'ACCEPT' };
2152         rule_substitude_action($rule, { ACCEPT =>  $accept_action});
2153         ruleset_generate_rule($ruleset, $chain, $ipversion, $rule);
2154
2155     } elsif ($policy eq 'DROP') {
2156
2157         ruleset_addrule($ruleset, $chain, "", "-j PVEFW-Drop");
2158
2159         ruleset_addrule($ruleset, $chain, "", "-j DROP", $loglevel, "policy $policy: ", $vmid);
2160     } elsif ($policy eq 'REJECT') {
2161         ruleset_addrule($ruleset, $chain, "", "-j PVEFW-Reject");
2162
2163         ruleset_addrule($ruleset, $chain, "", "-g PVEFW-reject", $loglevel, "policy $policy: ", $vmid);
2164     } else {
2165         # should not happen
2166         die "internal error: unknown policy '$policy'";
2167     }
2168 }
2169
2170 sub ruleset_chain_add_ndp {
2171     my ($ruleset, $chain, $ipversion, $options, $direction, $accept) = @_;
2172     return if $ipversion != 6 || (defined($options->{ndp}) && !$options->{ndp});
2173
2174     ruleset_addrule($ruleset, $chain, "-p icmpv6 --icmpv6-type router-solicitation", $accept);
2175     if ($direction ne 'OUT' || $options->{radv}) {
2176         ruleset_addrule($ruleset, $chain, "-p icmpv6 --icmpv6-type router-advertisement", $accept);
2177     }
2178     ruleset_addrule($ruleset, $chain, "-p icmpv6 --icmpv6-type neighbor-solicitation", $accept);
2179     ruleset_addrule($ruleset, $chain, "-p icmpv6 --icmpv6-type neighbor-advertisement", $accept);
2180 }
2181
2182 sub ruleset_chain_add_conn_filters {
2183     my ($ruleset, $chain, $allow_invalid, $accept) = @_;
2184
2185     if (!$allow_invalid) {
2186         ruleset_addrule($ruleset, $chain, "-m conntrack --ctstate INVALID", "-j DROP");
2187     }
2188     ruleset_addrule($ruleset, $chain, "-m conntrack --ctstate RELATED,ESTABLISHED", "-j $accept");
2189 }
2190
2191 sub ruleset_chain_add_input_filters {
2192     my ($ruleset, $chain, $ipversion, $options, $cluster_conf, $loglevel) = @_;
2193
2194     if ($cluster_conf->{ipset}->{blacklist}){
2195         if (!ruleset_chain_exist($ruleset, "PVEFW-blacklist")) {
2196             ruleset_create_chain($ruleset, "PVEFW-blacklist");
2197             ruleset_addrule($ruleset, "PVEFW-blacklist", "", "-j DROP", $loglevel, "DROP: ", 0);
2198         }
2199         my $ipset_chain = compute_ipset_chain_name(0, 'blacklist', $ipversion);
2200         ruleset_addrule($ruleset, $chain, "-m set --match-set ${ipset_chain} src", "-j PVEFW-blacklist");
2201     }
2202
2203     if (!(defined($options->{nosmurfs}) && $options->{nosmurfs} == 0)) {
2204         if ($ipversion == 4) {
2205             ruleset_addrule($ruleset, $chain, "-m conntrack --ctstate INVALID,NEW", "-j PVEFW-smurfs");
2206         }
2207     }
2208
2209     if ($options->{tcpflags}) {
2210         ruleset_addrule($ruleset, $chain, "-p tcp", "-j PVEFW-tcpflags");
2211     }
2212 }
2213
2214 sub ruleset_create_vm_chain {
2215     my ($ruleset, $chain, $ipversion, $options, $macaddr, $ipfilter_ipset, $direction) = @_;
2216
2217     ruleset_create_chain($ruleset, $chain);
2218     my $accept = generate_nfqueue($options);
2219
2220     if (!(defined($options->{dhcp}) && $options->{dhcp} == 0)) {
2221         if ($ipversion == 4) {
2222             if ($direction eq 'OUT') {
2223                 ruleset_generate_rule($ruleset, $chain, $ipversion, 
2224                                       { action => 'PVEFW-SET-ACCEPT-MARK',
2225                                         proto => 'udp', sport => 68, dport => 67 });
2226             } else {
2227                 ruleset_generate_rule($ruleset, $chain, $ipversion,
2228                                       { action => 'ACCEPT',
2229                                         proto => 'udp', sport => 67, dport => 68 });
2230             }
2231         } elsif ($ipversion == 6) {
2232             if ($direction eq 'OUT') {
2233                 ruleset_generate_rule($ruleset, $chain, $ipversion,
2234                                       { action => 'PVEFW-SET-ACCEPT-MARK',
2235                                         proto => 'udp', sport => 546, dport => 547 });
2236             } else {
2237                 ruleset_generate_rule($ruleset, $chain, $ipversion,
2238                                       { action => 'ACCEPT',
2239                                         proto => 'udp', sport => 547, dport => 546 });
2240             }
2241         }
2242
2243     }
2244
2245     if ($direction eq 'OUT') {
2246         if (defined($macaddr) && !(defined($options->{macfilter}) && $options->{macfilter} == 0)) {
2247             ruleset_addrule($ruleset, $chain, "-m mac ! --mac-source $macaddr", "-j DROP");
2248         }
2249         if ($ipversion == 6 && !$options->{radv}) {
2250             ruleset_addrule($ruleset, $chain, "-p icmpv6 --icmpv6-type router-advertisement", "-j DROP");
2251         }
2252         if ($ipfilter_ipset) {
2253             ruleset_addrule($ruleset, $chain, "-m set ! --match-set $ipfilter_ipset src", "-j DROP");
2254         }
2255         ruleset_addrule($ruleset, $chain, "", "-j MARK --set-mark $FWACCEPTMARK_OFF"); # clear mark
2256     }
2257
2258     my $accept_action = $direction eq 'OUT' ? '-g PVEFW-SET-ACCEPT-MARK' : "-j $accept";
2259     ruleset_chain_add_ndp($ruleset, $chain, $ipversion, $options, $direction, $accept_action);
2260 }
2261
2262 sub ruleset_add_group_rule {
2263     my ($ruleset, $cluster_conf, $chain, $rule, $direction, $action, $ipversion) = @_;
2264
2265     my $group = $rule->{action};
2266     my $group_chain = "GROUP-$group-$direction";
2267     if(!ruleset_chain_exist($ruleset, $group_chain)){
2268         generate_group_rules($ruleset, $cluster_conf, $group, $ipversion);
2269     }
2270
2271     if ($direction eq 'OUT' && $rule->{iface_out}) {
2272         ruleset_addrule($ruleset, $chain, "-o $rule->{iface_out}", "-j $group_chain");
2273     } elsif ($direction eq 'IN' && $rule->{iface_in}) {
2274         ruleset_addrule($ruleset, $chain, "-i $rule->{iface_in}", "-j $group_chain");
2275     } else {
2276         ruleset_addrule($ruleset, $chain, "", "-j $group_chain");
2277     }
2278
2279     ruleset_addrule($ruleset, $chain, "-m mark --mark $FWACCEPTMARK_ON", "-j $action");
2280 }
2281
2282 sub ruleset_generate_vm_rules {
2283     my ($ruleset, $rules, $cluster_conf, $vmfw_conf, $chain, $netid, $direction, $options, $ipversion, $vmid) = @_;
2284
2285     my $lc_direction = lc($direction);
2286
2287     my $in_accept = generate_nfqueue($options);
2288
2289     foreach my $rule (@$rules) {
2290         next if $rule->{iface} && $rule->{iface} ne $netid;
2291         next if !$rule->{enable} || $rule->{errors};
2292         next if $rule->{ipversion} && ($rule->{ipversion} != $ipversion);
2293
2294         if ($rule->{type} eq 'group') {
2295             ruleset_add_group_rule($ruleset, $cluster_conf, $chain, $rule, $direction,
2296                                    $direction eq 'OUT' ? 'RETURN' : $in_accept, $ipversion);
2297         } else {
2298             next if $rule->{type} ne $lc_direction;
2299             eval {
2300                 $rule->{logmsg} = "$rule->{action}: ";
2301                 if ($direction eq 'OUT') {
2302                     rule_substitude_action($rule, { ACCEPT => "PVEFW-SET-ACCEPT-MARK", REJECT => "PVEFW-reject" });
2303                     ruleset_generate_rule($ruleset, $chain, $ipversion, $rule, $cluster_conf, $vmfw_conf, $vmid);
2304                 } else {
2305                     rule_substitude_action($rule, { ACCEPT => $in_accept , REJECT => "PVEFW-reject" });
2306                     ruleset_generate_rule($ruleset, $chain, $ipversion, $rule, $cluster_conf, $vmfw_conf, $vmid);
2307                 }
2308             };
2309             warn $@ if $@;
2310         }
2311     }
2312 }
2313
2314 sub generate_nfqueue {
2315     my ($options) = @_;
2316
2317     if ($options->{ips}) {
2318         my $action = "NFQUEUE";
2319         if ($options->{ips_queues} && $options->{ips_queues} =~ m/^(\d+)(:(\d+))?$/) {
2320             if (defined($3) && defined($1)) {
2321                 $action .= " --queue-balance $1:$3";
2322             } elsif (defined($1)) {
2323                 $action .= " --queue-num $1";
2324             }
2325         }
2326         $action .= " --queue-bypass" if $feature_ipset_nomatch; #need kernel 3.10
2327         return $action;
2328     } else {
2329         return "ACCEPT";
2330     }
2331 }
2332
2333 sub ruleset_generate_vm_ipsrules {
2334     my ($ruleset, $options, $direction, $iface) = @_;
2335
2336     if ($options->{ips} && $direction eq 'IN') {
2337         my $nfqueue = generate_nfqueue($options);
2338
2339         if (!ruleset_chain_exist($ruleset, "PVEFW-IPS")) {
2340             ruleset_create_chain($ruleset, "PVEFW-IPS");
2341         }
2342
2343         ruleset_addrule($ruleset, "PVEFW-IPS", "-m physdev --physdev-out $iface --physdev-is-bridged", "-j $nfqueue");
2344     }
2345 }
2346
2347 sub generate_tap_rules_direction {
2348     my ($ruleset, $cluster_conf, $iface, $netid, $macaddr, $vmfw_conf, $vmid, $direction, $ipversion) = @_;
2349
2350     my $lc_direction = lc($direction);
2351
2352     my $rules = $vmfw_conf->{rules};
2353
2354     my $options = $vmfw_conf->{options};
2355     my $loglevel = get_option_log_level($options, "log_level_${lc_direction}");
2356
2357     my $tapchain = "$iface-$direction";
2358
2359     my $ipfilter_name = compute_ipfilter_ipset_name($netid);
2360     my $ipfilter_ipset = compute_ipset_chain_name($vmid, $ipfilter_name, $ipversion)
2361         if $options->{ipfilter} || $vmfw_conf->{ipset}->{$ipfilter_name};
2362
2363     # create chain with mac and ip filter
2364     ruleset_create_vm_chain($ruleset, $tapchain, $ipversion, $options, $macaddr, $ipfilter_ipset, $direction);
2365
2366     if ($options->{enable}) {
2367         ruleset_generate_vm_rules($ruleset, $rules, $cluster_conf, $vmfw_conf, $tapchain, $netid, $direction, $options, $ipversion, $vmid);
2368
2369         ruleset_generate_vm_ipsrules($ruleset, $options, $direction, $iface);
2370
2371         # implement policy
2372         my $policy;
2373
2374         if ($direction eq 'OUT') {
2375             $policy = $options->{policy_out} || 'ACCEPT'; # allow everything by default
2376         } else {
2377             $policy = $options->{policy_in} || 'DROP'; # allow nothing by default
2378         }
2379
2380         my $accept = generate_nfqueue($options);
2381         my $accept_action = $direction eq 'OUT' ? "PVEFW-SET-ACCEPT-MARK" : $accept;
2382         ruleset_add_chain_policy($ruleset, $tapchain, $ipversion, $vmid, $policy, $loglevel, $accept_action);
2383     } else {
2384         my $accept_action = $direction eq 'OUT' ? "PVEFW-SET-ACCEPT-MARK" : 'ACCEPT';
2385         ruleset_add_chain_policy($ruleset, $tapchain, $ipversion, $vmid, 'ACCEPT', $loglevel, $accept_action);
2386     }
2387
2388     # plug the tap chain to bridge chain
2389     if ($direction eq 'IN') {
2390         ruleset_addrule($ruleset, "PVEFW-FWBR-IN",
2391                         "-m physdev --physdev-is-bridged --physdev-out $iface", "-j $tapchain");
2392     } else {
2393         ruleset_addrule($ruleset, "PVEFW-FWBR-OUT",
2394                         "-m physdev --physdev-is-bridged --physdev-in $iface", "-j $tapchain");
2395     }
2396 }
2397
2398 sub enable_host_firewall {
2399     my ($ruleset, $hostfw_conf, $cluster_conf, $ipversion, $corosync_conf) = @_;
2400
2401     my $options = $hostfw_conf->{options};
2402     my $cluster_options = $cluster_conf->{options};
2403     my $rules = $hostfw_conf->{rules};
2404     my $cluster_rules = $cluster_conf->{rules};
2405
2406     # corosync preparation
2407     my $corosync_rule = "-p udp --dport 5404:5405";
2408     my $corosync_local_addresses = {};
2409     my $multicast_enabled;
2410     my $local_hostname = PVE::INotify::nodename();
2411     if (defined($corosync_conf)) {
2412         PVE::Corosync::for_all_corosync_addresses($corosync_conf, $ipversion, sub {
2413             my ($node_name, $node_ip, $node_ipversion, $key) = @_;
2414
2415             if ($node_name eq $local_hostname) {
2416                 $corosync_local_addresses->{$key} = $node_ip;
2417             }
2418         });
2419
2420         # allow multicast only if enabled in config
2421         my $corosync_transport = $corosync_conf->{main}->{totem}->{transport};
2422         $multicast_enabled = defined($corosync_transport) && $corosync_transport eq 'udp';
2423     }
2424
2425     # host inbound firewall
2426     my $chain = "PVEFW-HOST-IN";
2427     ruleset_create_chain($ruleset, $chain);
2428
2429     my $loglevel = get_option_log_level($options, "log_level_in");
2430
2431     ruleset_addrule($ruleset, $chain, "-i lo", "-j ACCEPT");
2432
2433     ruleset_chain_add_conn_filters($ruleset, $chain, 0, 'ACCEPT');
2434     ruleset_chain_add_ndp($ruleset, $chain, $ipversion, $options, 'IN', '-j RETURN');
2435     ruleset_chain_add_input_filters($ruleset, $chain, $ipversion, $options, $cluster_conf, $loglevel);
2436
2437     # we use RETURN because we need to check also tap rules
2438     my $accept_action = 'RETURN';
2439
2440     ruleset_addrule($ruleset, $chain, "-p igmp", "-j $accept_action"); # important for multicast
2441
2442     # add host rules first, so that cluster wide rules can be overwritten
2443     foreach my $rule (@$rules, @$cluster_rules) {
2444         next if !$rule->{enable} || $rule->{errors};
2445         next if $rule->{ipversion} && ($rule->{ipversion} != $ipversion);
2446
2447         $rule->{iface_in} = $rule->{iface} if $rule->{iface};
2448
2449         eval {
2450             if ($rule->{type} eq 'group') {
2451                 ruleset_add_group_rule($ruleset, $cluster_conf, $chain, $rule, 'IN', $accept_action, $ipversion);
2452             } elsif ($rule->{type} eq 'in') {
2453                 rule_substitude_action($rule, { ACCEPT => $accept_action, REJECT => "PVEFW-reject" });
2454                 ruleset_generate_rule($ruleset, $chain, $ipversion, $rule, $cluster_conf, $hostfw_conf, 0);
2455             }
2456         };
2457         warn $@ if $@;
2458         delete $rule->{iface_in};
2459     }
2460
2461     # allow standard traffic for management ipset (includes cluster network)
2462     my $mngmnt_ipset_chain = compute_ipset_chain_name(0, "management", $ipversion);
2463     my $mngmntsrc = "-m set --match-set ${mngmnt_ipset_chain} src";
2464     ruleset_addrule($ruleset, $chain, "$mngmntsrc -p tcp --dport 8006", "-j $accept_action");  # PVE API
2465     ruleset_addrule($ruleset, $chain, "$mngmntsrc -p tcp --dport 5900:5999", "-j $accept_action");  # PVE VNC Console
2466     ruleset_addrule($ruleset, $chain, "$mngmntsrc -p tcp --dport 3128", "-j $accept_action");  # SPICE Proxy
2467     ruleset_addrule($ruleset, $chain, "$mngmntsrc -p tcp --dport 22", "-j $accept_action");  # SSH
2468
2469     # corosync inbound rules
2470     if (defined($corosync_conf)) {
2471         ruleset_addrule($ruleset, $chain, "-m addrtype --dst-type MULTICAST $corosync_rule", "-j $accept_action")
2472             if $multicast_enabled;
2473
2474         PVE::Corosync::for_all_corosync_addresses($corosync_conf, $ipversion, sub {
2475             my ($node_name, $node_ip, $node_ipversion, $key) = @_;
2476             my $destination = $corosync_local_addresses->{$key};
2477
2478             if ($node_name ne $local_hostname && defined($destination)) {
2479                 # accept only traffic on same ring
2480                 ruleset_addrule($ruleset, $chain, "-d $destination -s $node_ip $corosync_rule", "-j $accept_action");
2481             }
2482         });
2483     }
2484
2485     # implement input policy
2486     my $policy = $cluster_options->{policy_in} || 'DROP'; # allow nothing by default
2487     ruleset_add_chain_policy($ruleset, $chain, $ipversion, 0, $policy, $loglevel, $accept_action);
2488
2489     # host outbound firewall
2490     $chain = "PVEFW-HOST-OUT";
2491     ruleset_create_chain($ruleset, $chain);
2492
2493     $loglevel = get_option_log_level($options, "log_level_out");
2494
2495     ruleset_addrule($ruleset, $chain, "-o lo", "-j ACCEPT");
2496
2497     ruleset_chain_add_conn_filters($ruleset, $chain, 0, 'ACCEPT');
2498
2499     # we use RETURN because we may want to check other thigs later
2500     $accept_action = 'RETURN';
2501     ruleset_chain_add_ndp($ruleset, $chain, $ipversion, $options, 'OUT', "-j $accept_action");
2502
2503     ruleset_addrule($ruleset, $chain, "-p igmp", "-j $accept_action"); # important for multicast
2504
2505     # add host rules first, so that cluster wide rules can be overwritten
2506     foreach my $rule (@$rules, @$cluster_rules) {
2507         next if !$rule->{enable} || $rule->{errors};
2508         next if $rule->{ipversion} && ($rule->{ipversion} != $ipversion);
2509
2510         $rule->{iface_out} = $rule->{iface} if $rule->{iface};
2511         eval {
2512             $rule->{logmsg} = "$rule->{action}: ";
2513             if ($rule->{type} eq 'group') {
2514                 ruleset_add_group_rule($ruleset, $cluster_conf, $chain, $rule, 'OUT', $accept_action, $ipversion);
2515             } elsif ($rule->{type} eq 'out') {
2516                 rule_substitude_action($rule, { ACCEPT => $accept_action, REJECT => "PVEFW-reject" });
2517                 ruleset_generate_rule($ruleset, $chain, $ipversion, $rule, $cluster_conf, $hostfw_conf, 0);
2518             }
2519         };
2520         warn $@ if $@;
2521         delete $rule->{iface_out};
2522     }
2523
2524     # allow standard traffic on cluster network
2525     my $localnet = $cluster_conf->{aliases}->{local_network}->{cidr};
2526     my $localnet_ver = $cluster_conf->{aliases}->{local_network}->{ipversion};
2527
2528     if ($localnet && ($ipversion == $localnet_ver)) {
2529         ruleset_addrule($ruleset, $chain, "-d $localnet -p tcp --dport 8006", "-j $accept_action");  # PVE API
2530         ruleset_addrule($ruleset, $chain, "-d $localnet -p tcp --dport 22", "-j $accept_action");  # SSH
2531         ruleset_addrule($ruleset, $chain, "-d $localnet -p tcp --dport 5900:5999", "-j $accept_action");  # PVE VNC Console
2532         ruleset_addrule($ruleset, $chain, "-d $localnet -p tcp --dport 3128", "-j $accept_action");  # SPICE Proxy
2533     }
2534
2535     # corosync outbound rules
2536     if (defined($corosync_conf)) {
2537         ruleset_addrule($ruleset, $chain, "-m addrtype --dst-type MULTICAST $corosync_rule", "-j $accept_action")
2538             if $multicast_enabled;
2539
2540         PVE::Corosync::for_all_corosync_addresses($corosync_conf, $ipversion, sub {
2541             my ($node_name, $node_ip, $node_ipversion, $key) = @_;
2542             my $source = $corosync_local_addresses->{$key};
2543
2544             if ($node_name ne $local_hostname && defined($source)) {
2545                 # accept only traffic on same ring
2546                 ruleset_addrule($ruleset, $chain, "-s $source -d $node_ip $corosync_rule", "-j $accept_action");
2547             }
2548         });
2549     }
2550
2551     # implement output policy
2552     $policy = $cluster_options->{policy_out} || 'ACCEPT'; # allow everything by default
2553     ruleset_add_chain_policy($ruleset, $chain, $ipversion, 0, $policy, $loglevel, $accept_action);
2554
2555     ruleset_addrule($ruleset, "PVEFW-OUTPUT", "", "-j PVEFW-HOST-OUT");
2556     ruleset_addrule($ruleset, "PVEFW-INPUT", "", "-j PVEFW-HOST-IN");
2557 }
2558
2559 sub generate_group_rules {
2560     my ($ruleset, $cluster_conf, $group, $ipversion) = @_;
2561
2562     my $rules = $cluster_conf->{groups}->{$group};
2563
2564     if (!$rules) {
2565         warn "no such security group '$group'\n";
2566         $rules = []; # create empty chain
2567     }
2568
2569     my $chain = "GROUP-${group}-IN";
2570
2571     ruleset_create_chain($ruleset, $chain);
2572     ruleset_addrule($ruleset, $chain, "", "-j MARK --set-mark $FWACCEPTMARK_OFF"); # clear mark
2573
2574     foreach my $rule (@$rules) {
2575         next if $rule->{type} ne 'in';
2576         next if !$rule->{enable} || $rule->{errors};
2577         next if $rule->{ipversion} && $rule->{ipversion} ne $ipversion;
2578         rule_substitude_action($rule, { ACCEPT => "PVEFW-SET-ACCEPT-MARK", REJECT => "PVEFW-reject" });
2579         ruleset_generate_rule($ruleset, $chain, $ipversion, $rule, $cluster_conf);
2580     }
2581
2582     $chain = "GROUP-${group}-OUT";
2583
2584     ruleset_create_chain($ruleset, $chain);
2585     ruleset_addrule($ruleset, $chain, "", "-j MARK --set-mark $FWACCEPTMARK_OFF"); # clear mark
2586
2587     foreach my $rule (@$rules) {
2588         next if $rule->{type} ne 'out';
2589         next if !$rule->{enable} || $rule->{errors};
2590         next if $rule->{ipversion} && $rule->{ipversion} ne $ipversion;
2591         # we use PVEFW-SET-ACCEPT-MARK (Instead of ACCEPT) because we need to
2592         # check also other tap rules later
2593         rule_substitude_action($rule, { ACCEPT => 'PVEFW-SET-ACCEPT-MARK', REJECT => "PVEFW-reject" });
2594         ruleset_generate_rule($ruleset, $chain, $ipversion, $rule, $cluster_conf);
2595     }
2596 }
2597
2598 my $MAX_NETS = 32;
2599 my $valid_netdev_names = {};
2600 for (my $i = 0; $i < $MAX_NETS; $i++)  {
2601     $valid_netdev_names->{"net$i"} = 1;
2602 }
2603
2604 sub get_mark_values {
2605     my ($value, $mask) = @_;
2606     $value = hex($value) if $value =~ /^0x/;
2607     $mask = hex($mask) if defined($mask) && $mask =~ /^0x/;
2608     $mask = 0xffffffff if !defined($mask);
2609     return ($value, $mask);
2610 }
2611
2612 sub parse_fw_rule {
2613     my ($prefix, $line, $cluster_conf, $fw_conf, $rule_env) = @_;
2614
2615     my $orig_line = $line;
2616
2617     my $rule = {};
2618
2619     # we can add single line comments to the end of the rule
2620     if ($line =~ s/#\s*(.*?)\s*$//) {
2621         $rule->{comment} = decode('utf8', $1);
2622     }
2623
2624     # we can disable a rule when prefixed with '|'
2625
2626     $rule->{enable} = $line =~ s/^\|// ? 0 : 1;
2627
2628     $line =~ s/^(\S+)\s+(\S+)\s*// ||
2629         die "unable to parse rule: $line\n";
2630
2631     $rule->{type} = lc($1);
2632     $rule->{action} = $2;
2633
2634     if ($rule->{type} eq  'in' || $rule->{type} eq 'out') {
2635         if ($rule->{action} =~ m/^(\S+)\((ACCEPT|DROP|REJECT)\)$/) {
2636             $rule->{macro} = $1;
2637             $rule->{action} = $2;
2638         }
2639     }
2640
2641     while (length($line)) {
2642         if ($line =~ s/^-i (\S+)\s*//) {
2643             $rule->{iface} = $1;
2644             next;
2645         }
2646
2647         last if $rule->{type} eq 'group';
2648
2649         if ($line =~ s/^-p (\S+)\s*//) {
2650             $rule->{proto} = $1;
2651             next;
2652         }
2653
2654         if ($line =~ s/^-dport (\S+)\s*//) {
2655             $rule->{dport} = $1;
2656             next;
2657         }
2658
2659         if ($line =~ s/^-sport (\S+)\s*//) {
2660             $rule->{sport} = $1;
2661             next;
2662         }
2663         if ($line =~ s/^-source (\S+)\s*//) {
2664             $rule->{source} = $1;
2665             next;
2666         }
2667         if ($line =~ s/^-dest (\S+)\s*//) {
2668             $rule->{dest} = $1;
2669             next;
2670         }
2671         if ($line =~ s/^-log (emerg|alert|crit|err|warning|notice|info|debug|nolog)\s*//) {
2672             $rule->{log} = $1;
2673             next;
2674         }
2675
2676         last;
2677     }
2678
2679     die "unable to parse rule parameters: $line\n" if length($line);
2680
2681     $rule = verify_rule($rule, $cluster_conf, $fw_conf, $rule_env, 1);
2682     if ($rule->{errors}) {
2683         # The verbose flag really means we're running from the CLI and want
2684         # output on the console - in the other case we really want such errors
2685         # to go into the syslog instead.
2686         my $log = $verbose ? sub { warn @_ } : sub { syslog(err => @_) };
2687         $log->("$prefix - errors in rule parameters: $orig_line\n");
2688         foreach my $p (keys %{$rule->{errors}}) {
2689             $log->("  $p: $rule->{errors}->{$p}\n");
2690         }
2691     }
2692
2693     return $rule;
2694 }
2695
2696 sub verify_ethertype {
2697     my ($value) = @_;
2698     my $types = get_etc_ethertypes();
2699     die "unknown ethernet protocol type: $value\n"
2700         if !defined($types->{byname}->{$value}) &&
2701            !defined($types->{byid}->{$value});
2702 }
2703
2704 sub parse_vmfw_option {
2705     my ($line) = @_;
2706
2707     my ($opt, $value);
2708
2709     my $loglevels = "emerg|alert|crit|err|warning|notice|info|debug|nolog";
2710
2711     if ($line =~ m/^(enable|dhcp|ndp|radv|macfilter|ipfilter|ips):\s*(0|1)\s*$/i) {
2712         $opt = lc($1);
2713         $value = int($2);
2714     } elsif ($line =~ m/^(log_level_in|log_level_out):\s*(($loglevels)\s*)?$/i) {
2715         $opt = lc($1);
2716         $value = $2 ? lc($3) : '';
2717     } elsif ($line =~ m/^(policy_(in|out)):\s*(ACCEPT|DROP|REJECT)\s*$/i) {
2718         $opt = lc($1);
2719         $value = uc($3);
2720     } elsif ($line =~ m/^(ips_queues):\s*((\d+)(:(\d+))?)\s*$/i) {
2721         $opt = lc($1);
2722         $value = $2;
2723     } elsif ($line =~ m/^(layer2_protocols):\s*(((\S+)[,]?)+)\s*$/i) {
2724         $opt = lc($1);
2725         $value = $2;
2726         verify_ethertype($_) foreach split(/\s*,\s*/, $value);
2727     } else {
2728         die "can't parse option '$line'\n"
2729     }
2730
2731     return ($opt, $value);
2732 }
2733
2734 sub parse_hostfw_option {
2735     my ($line) = @_;
2736
2737     my ($opt, $value);
2738
2739     my $loglevels = "emerg|alert|crit|err|warning|notice|info|debug|nolog";
2740
2741     if ($line =~ m/^(enable|nosmurfs|tcpflags|ndp|log_nf_conntrack|nf_conntrack_allow_invalid):\s*(0|1)\s*$/i) {
2742         $opt = lc($1);
2743         $value = int($2);
2744     } elsif ($line =~ m/^(log_level_in|log_level_out|tcp_flags_log_level|smurf_log_level):\s*(($loglevels)\s*)?$/i) {
2745         $opt = lc($1);
2746         $value = $2 ? lc($3) : '';
2747     } elsif ($line =~ m/^(nf_conntrack_max|nf_conntrack_tcp_timeout_established):\s*(\d+)\s*$/i) {
2748         $opt = lc($1);
2749         $value = int($2);
2750     } else {
2751         die "can't parse option '$line'\n"
2752     }
2753
2754     return ($opt, $value);
2755 }
2756
2757 sub parse_clusterfw_option {
2758     my ($line) = @_;
2759
2760     my ($opt, $value);
2761
2762     if ($line =~ m/^(enable):\s*(\d+)\s*$/i) {
2763         $opt = lc($1);
2764         $value = int($2);
2765         if (($value > 1) && ((time() - $value) > 60)) {
2766             $value = 0
2767         }
2768     } elsif ($line =~ m/^(ebtables):\s*(0|1)\s*$/i) {
2769         $opt = lc($1);
2770         $value = int($2);
2771     } elsif ($line =~ m/^(policy_(in|out)):\s*(ACCEPT|DROP|REJECT)\s*$/i) {
2772         $opt = lc($1);
2773         $value = uc($3);
2774     } elsif ($line =~ m/^(log_ratelimit):\s*(\S+)\s*$/) {
2775         $opt = lc($1);
2776         $value = $2;
2777     } else {
2778         die "can't parse option '$line'\n"
2779     }
2780
2781     return ($opt, $value);
2782 }
2783
2784 sub resolve_alias {
2785     my ($clusterfw_conf, $fw_conf, $cidr) = @_;
2786
2787     my $alias = lc($cidr);
2788     my $e = $fw_conf ? $fw_conf->{aliases}->{$alias} : undef;
2789     $e = $clusterfw_conf->{aliases}->{$alias} if !$e && $clusterfw_conf;
2790
2791     die "no such alias '$cidr'\n" if !$e;;
2792
2793     return wantarray ? ($e->{cidr}, $e->{ipversion}) : $e->{cidr};
2794 }
2795
2796 sub parse_ip_or_cidr {
2797     my ($cidr) = @_;
2798
2799     my $ipversion;
2800     
2801     if ($cidr =~ m!^(?:$IPV6RE)(/(\d+))?$!) {
2802         $cidr =~ s|/128$||;
2803         $ipversion = 6;
2804     } elsif ($cidr =~ m!^(?:$IPV4RE)(/(\d+))?$!) {
2805         $cidr =~ s|/32$||;
2806         $ipversion = 4;
2807     } else {
2808         die "value does not look like a valid IP address or CIDR network\n";
2809     }
2810
2811     return wantarray ? ($cidr, $ipversion) : $cidr;
2812 }
2813
2814 sub parse_alias {
2815     my ($line) = @_;
2816
2817     # we can add single line comments to the end of the line
2818     my $comment = decode('utf8', $1) if $line =~ s/\s*#\s*(.*?)\s*$//;
2819
2820     if ($line =~ m/^(\S+)\s(\S+)$/) {
2821         my ($name, $cidr) = ($1, $2);
2822         my $ipversion;
2823
2824         ($cidr, $ipversion) = parse_ip_or_cidr($cidr);
2825
2826         my $data = {
2827             name => $name,
2828             cidr => $cidr,
2829             ipversion => $ipversion,
2830         };
2831         $data->{comment} = $comment  if $comment;
2832         return $data;
2833     }
2834
2835     return undef;
2836 }
2837
2838 sub generic_fw_config_parser {
2839     my ($filename, $cluster_conf, $empty_conf, $rule_env) = @_;
2840
2841     my $section;
2842     my $group;
2843
2844     my $res = $empty_conf;
2845
2846     my $raw;
2847     if ($filename =~ m!^/etc/pve/(.*)$!) {
2848         $raw = PVE::Cluster::get_config($1);
2849     } else {
2850         $raw = eval { PVE::Tools::file_get_contents($filename) }; # ignore errors
2851     }
2852     return {} if !$raw;
2853
2854     my $linenr = 0;
2855     while ($raw =~ /^\h*(.*?)\h*$/gm) {
2856         my $line = $1;
2857         $linenr++;
2858         next if $line =~ m/^#/;
2859         next if $line =~ m/^\s*$/;
2860         chomp $line;
2861
2862         my $prefix = "$filename (line $linenr)";
2863
2864         if ($empty_conf->{options} && ($line =~ m/^\[options\]$/i)) {
2865             $section = 'options';
2866             next;
2867         }
2868
2869         if ($empty_conf->{aliases} && ($line =~ m/^\[aliases\]$/i)) {
2870             $section = 'aliases';
2871             next;
2872         }
2873
2874         if ($empty_conf->{groups} && ($line =~ m/^\[group\s+(\S+)\]\s*(?:#\s*(.*?)\s*)?$/i)) {
2875             $section = 'groups';
2876             $group = lc($1);
2877             my $comment = $2;
2878             eval {
2879                 die "security group name too long\n" if length($group) > $max_group_name_length;
2880                 die "invalid security group name '$group'\n" if $group !~ m/^${security_group_name_pattern}$/;
2881             };
2882             if (my $err = $@) {
2883                 ($section, $group, $comment) = undef;
2884                 warn "$prefix: $err";
2885                 next;
2886             }
2887             
2888             $res->{$section}->{$group} = [];
2889             $res->{group_comments}->{$group} =  decode('utf8', $comment)
2890                 if $comment;
2891             next;
2892         }
2893
2894         if ($empty_conf->{rules} && ($line =~ m/^\[rules\]$/i)) {
2895             $section = 'rules';
2896             next;
2897         }
2898
2899         if ($empty_conf->{ipset} && ($line =~ m/^\[ipset\s+(\S+)\]\s*(?:#\s*(.*?)\s*)?$/i)) {
2900             $section = 'ipset';
2901             $group = lc($1);
2902             my $comment = $2;
2903             eval {      
2904                 die "ipset name too long\n" if length($group) > $max_ipset_name_length;
2905                 die "invalid ipset name '$group'\n" if $group !~ m/^${ipset_name_pattern}$/;
2906             };
2907             if (my $err = $@) {
2908                 ($section, $group, $comment) = undef;
2909                 warn "$prefix: $err";
2910                 next;
2911             }
2912
2913             $res->{$section}->{$group} = [];
2914             $res->{ipset_comments}->{$group} = decode('utf8', $comment)
2915                 if $comment;
2916             next;
2917         }
2918
2919         if (!$section) {
2920             warn "$prefix: skip line - no section\n";
2921             next;
2922         }
2923
2924         if ($section eq 'options') {
2925             eval {
2926                 my ($opt, $value);
2927                 if ($rule_env eq 'cluster') {
2928                     ($opt, $value) = parse_clusterfw_option($line);
2929                 } elsif ($rule_env eq 'host') {
2930                     ($opt, $value) = parse_hostfw_option($line);
2931                 } else {
2932                     ($opt, $value) = parse_vmfw_option($line);
2933                 }
2934                 $res->{options}->{$opt} = $value;
2935             };
2936             warn "$prefix: $@" if $@;
2937         } elsif ($section eq 'aliases') {
2938             eval {
2939                 my $data = parse_alias($line);
2940                 $res->{aliases}->{lc($data->{name})} = $data;
2941             };
2942             warn "$prefix: $@" if $@;
2943         } elsif ($section eq 'rules') {
2944             my $rule;
2945             eval { $rule = parse_fw_rule($prefix, $line, $cluster_conf, $res, $rule_env); };
2946             if (my $err = $@) {
2947                 warn "$prefix: $err";
2948                 next;
2949             }
2950             push @{$res->{$section}}, $rule;
2951         } elsif ($section eq 'groups') {
2952             my $rule;
2953             eval { $rule = parse_fw_rule($prefix, $line, $cluster_conf, undef, 'group'); };
2954             if (my $err = $@) {
2955                 warn "$prefix: $err";
2956                 next;
2957             }
2958             push @{$res->{$section}->{$group}}, $rule;
2959         } elsif ($section eq 'ipset') {
2960             # we can add single line comments to the end of the rule
2961             my $comment = decode('utf8', $1) if $line =~ s/#\s*(.*?)\s*$//;
2962
2963             $line =~ m/^(\!)?\s*(\S+)\s*$/;
2964             my $nomatch = $1;
2965             my $cidr = $2;
2966             my $errors;
2967
2968             if ($nomatch && !$feature_ipset_nomatch) {
2969                 $errors->{nomatch} = "nomatch not supported by kernel";
2970             }
2971
2972             eval { 
2973                 if ($cidr =~ m/^${ip_alias_pattern}$/) {
2974                     resolve_alias($cluster_conf, $res, $cidr); # make sure alias exists
2975                 } else {
2976                     $cidr = parse_ip_or_cidr($cidr);
2977                 }
2978             };
2979             if (my $err = $@) {
2980                 chomp $err;
2981                 $errors->{cidr} = $err;
2982             }
2983
2984             if ($cidr =~ m!/0+$!) {
2985                 $errors->{cidr} = "a zero prefix is not allowed in ipset entries\n";
2986             }
2987
2988             my $entry = { cidr => $cidr };
2989             $entry->{nomatch} = 1 if $nomatch;
2990             $entry->{comment} = $comment if $comment;
2991             $entry->{errors} =  $errors if $errors;
2992
2993             if ($verbose && $errors) {
2994                 warn "$prefix - errors in ipset '$group': $line\n";
2995                 foreach my $p (keys %{$errors}) {
2996                     warn "  $p: $errors->{$p}\n";
2997                 }
2998             }
2999
3000             push @{$res->{$section}->{$group}}, $entry;
3001         } else {
3002             warn "$prefix: skip line - unknown section\n";
3003             next;
3004         }
3005     }
3006
3007     return $res;
3008 }
3009
3010 sub run_locked {
3011     my ($code, @param) = @_;
3012
3013     my $timeout = 10;
3014
3015     my $res = lock_file($pve_fw_lock_filename, $timeout, $code, @param);
3016
3017     die $@ if $@;
3018
3019     return $res;
3020 }
3021
3022 sub read_local_vm_config {
3023
3024     my $qemu = {};
3025     my $lxc = {};
3026
3027     my $vmdata = { qemu => $qemu, lxc => $lxc };
3028
3029     my $vmlist = PVE::Cluster::get_vmlist();
3030     return $vmdata if !$vmlist || !$vmlist->{ids};
3031     my $ids = $vmlist->{ids};
3032
3033     foreach my $vmid (keys %$ids) {
3034         next if !$vmid; # skip VE0
3035         my $d = $ids->{$vmid};
3036         next if !$d->{node} || $d->{node} ne $nodename;
3037         next if !$d->{type};
3038         if ($d->{type} eq 'qemu') {
3039             if ($have_qemu_server) {
3040                 my $cfspath = PVE::QemuConfig->cfs_config_path($vmid);
3041                 if (my $conf = PVE::Cluster::cfs_read_file($cfspath)) {
3042                     $qemu->{$vmid} = $conf;
3043                 }
3044             }
3045         } elsif ($d->{type} eq 'lxc') {
3046             if ($have_lxc) {
3047                 my $cfspath = PVE::LXC::Config->cfs_config_path($vmid);
3048                 if (my $conf = PVE::Cluster::cfs_read_file($cfspath)) {
3049                     $lxc->{$vmid} = $conf;
3050                 }
3051             }
3052         }
3053     }
3054
3055     return $vmdata;
3056 };
3057
3058 sub load_vmfw_conf {
3059     my ($cluster_conf, $rule_env, $vmid, $dir) = @_;
3060
3061     $dir = $pvefw_conf_dir if !defined($dir);
3062     my $filename = "$dir/$vmid.fw";
3063
3064     my $empty_conf = {
3065         rules => [],
3066         options => {},
3067         aliases => {},
3068         ipset => {} ,
3069         ipset_comments => {},
3070     };
3071
3072     my $vmfw_conf = generic_fw_config_parser($filename, $cluster_conf, $empty_conf, $rule_env);
3073     $vmfw_conf->{vmid} = $vmid;
3074
3075     return $vmfw_conf;
3076 }
3077
3078 my $format_rules = sub {
3079     my ($rules, $allow_iface) = @_;
3080
3081     my $raw = '';
3082
3083     foreach my $rule (@$rules) {
3084         if ($rule->{type} eq  'in' || $rule->{type} eq 'out' || $rule->{type} eq 'group') {
3085             $raw .= '|' if defined($rule->{enable}) && !$rule->{enable};
3086             $raw .= uc($rule->{type});
3087             if ($rule->{macro}) {
3088                 $raw .= " $rule->{macro}($rule->{action})";
3089             } else {
3090                 $raw .= " " . $rule->{action};
3091             }
3092             if ($allow_iface && $rule->{iface}) {
3093                 $raw .= " -i $rule->{iface}";
3094             }
3095
3096             if ($rule->{type} ne  'group')  {
3097                 $raw .= " -source $rule->{source}" if $rule->{source};
3098                 $raw .= " -dest $rule->{dest}" if $rule->{dest};
3099                 $raw .= " -p $rule->{proto}" if $rule->{proto};
3100                 $raw .= " -dport $rule->{dport}" if $rule->{dport};
3101                 $raw .= " -sport $rule->{sport}" if $rule->{sport};
3102                 $raw .= " -log $rule->{log}" if $rule->{log};
3103             }
3104
3105             $raw .= " # " . encode('utf8', $rule->{comment})
3106                 if $rule->{comment} && $rule->{comment} !~ m/^\s*$/;
3107             $raw .= "\n";
3108         } else {
3109             die "unknown rule type '$rule->{type}'";
3110         }
3111     }
3112
3113     return $raw;
3114 };
3115
3116 my $format_options = sub {
3117     my ($options) = @_;
3118
3119     my $raw = '';
3120
3121     $raw .= "[OPTIONS]\n\n";
3122     foreach my $opt (keys %$options) {
3123         $raw .= "$opt: $options->{$opt}\n";
3124     }
3125     $raw .= "\n";
3126
3127     return $raw;
3128 };
3129
3130 my $format_aliases = sub {
3131     my ($aliases) = @_;
3132
3133     my $raw = '';
3134
3135     $raw .= "[ALIASES]\n\n";
3136     foreach my $k (keys %$aliases) {
3137         my $e = $aliases->{$k};
3138         $raw .= "$e->{name} $e->{cidr}";
3139         $raw .= " # " . encode('utf8', $e->{comment})
3140             if $e->{comment} && $e->{comment} !~ m/^\s*$/;
3141         $raw .= "\n";
3142     }
3143     $raw .= "\n";
3144
3145     return $raw;
3146 };
3147
3148 my $format_ipsets = sub {
3149     my ($fw_conf) = @_;
3150     
3151     my $raw = '';
3152
3153     foreach my $ipset (sort keys %{$fw_conf->{ipset}}) {
3154         if (my $comment = $fw_conf->{ipset_comments}->{$ipset}) {
3155             my $utf8comment = encode('utf8', $comment);
3156             $raw .= "[IPSET $ipset] # $utf8comment\n\n";
3157         } else {
3158             $raw .= "[IPSET $ipset]\n\n";
3159         }
3160         my $options = $fw_conf->{ipset}->{$ipset};
3161
3162         my $nethash = {};
3163         foreach my $entry (@$options) {
3164             $nethash->{$entry->{cidr}} = $entry;
3165         }
3166
3167         foreach my $cidr (sort keys %$nethash) {
3168             my $entry = $nethash->{$cidr};
3169             my $line = $entry->{nomatch} ? '!' : '';
3170             $line .= $entry->{cidr};
3171             $line .= " # " . encode('utf8', $entry->{comment})
3172                 if $entry->{comment} && $entry->{comment} !~ m/^\s*$/;
3173             $raw .= "$line\n";
3174         }
3175
3176         $raw .= "\n";
3177     }
3178
3179     return $raw;
3180 };
3181
3182 sub save_vmfw_conf {
3183     my ($vmid, $vmfw_conf) = @_;
3184
3185     my $raw = '';
3186
3187     my $options = $vmfw_conf->{options};
3188     $raw .= &$format_options($options) if $options && scalar(keys %$options);
3189
3190     my $aliases = $vmfw_conf->{aliases};
3191     $raw .= &$format_aliases($aliases) if $aliases && scalar(keys %$aliases);
3192
3193     $raw .= &$format_ipsets($vmfw_conf) if $vmfw_conf->{ipset};
3194
3195     my $rules = $vmfw_conf->{rules} || [];
3196     if ($rules && scalar(@$rules)) {
3197         $raw .= "[RULES]\n\n";
3198         $raw .= &$format_rules($rules, 1);
3199         $raw .= "\n";
3200     }
3201
3202     my $filename = "$pvefw_conf_dir/$vmid.fw";
3203     if ($raw) {
3204         mkdir $pvefw_conf_dir;
3205         PVE::Tools::file_set_contents($filename, $raw);
3206     } else {
3207         unlink $filename;
3208     }
3209 }
3210
3211 sub remove_vmfw_conf {
3212     my ($vmid) = @_;
3213
3214     my $vmfw_conffile = "$pvefw_conf_dir/$vmid.fw";
3215
3216     unlink $vmfw_conffile;
3217 }
3218
3219 sub clone_vmfw_conf {
3220     my ($vmid, $newid) = @_;
3221
3222     my $sourcevm_conffile = "$pvefw_conf_dir/$vmid.fw";
3223     my $clonevm_conffile = "$pvefw_conf_dir/$newid.fw";
3224
3225     if (-f $clonevm_conffile) {
3226         unlink $clonevm_conffile;
3227     }
3228     if (-f $sourcevm_conffile) {
3229         my $data = PVE::Tools::file_get_contents($sourcevm_conffile);
3230         PVE::Tools::file_set_contents($clonevm_conffile, $data);
3231     }
3232 }
3233
3234 sub read_vm_firewall_configs {
3235     my ($cluster_conf, $vmdata, $dir) = @_;
3236
3237     my $vmfw_configs = {};
3238
3239     foreach my $vmid (keys %{$vmdata->{qemu}}) {
3240         my $vmfw_conf = load_vmfw_conf($cluster_conf, 'vm', $vmid, $dir);
3241         next if !$vmfw_conf->{options}; # skip if file does not exists
3242         $vmfw_configs->{$vmid} = $vmfw_conf;
3243     }
3244     foreach my $vmid (keys %{$vmdata->{lxc}}) {
3245         my $vmfw_conf = load_vmfw_conf($cluster_conf, 'ct', $vmid, $dir);
3246         next if !$vmfw_conf->{options}; # skip if file does not exists
3247         $vmfw_configs->{$vmid} = $vmfw_conf;
3248     }
3249
3250     return $vmfw_configs;
3251 }
3252
3253 sub get_option_log_level {
3254     my ($options, $k) = @_;
3255
3256     my $v = $options->{$k};
3257     $v = $default_log_level if !defined($v);
3258
3259     return undef if $v eq '' || $v eq 'nolog';
3260
3261     return $v if defined($log_level_hash->{$v});
3262
3263     warn "unknown log level ($k = '$v')\n";
3264
3265     return undef;
3266 }
3267
3268 sub generate_std_chains {
3269     my ($ruleset, $options, $ipversion) = @_;
3270
3271     my $std_chains = $pve_std_chains->{$ipversion} || die "internal error";
3272
3273     my $loglevel = get_option_log_level($options, 'smurf_log_level');
3274     my $chain = 'PVEFW-smurflog';
3275     if ( $std_chains->{$chain} ) {
3276         foreach my $r (@{$std_chains->{$chain}}) {
3277           $r->{log} = $loglevel;
3278         }
3279     }
3280
3281     # same as shorewall logflags action.
3282     $loglevel = get_option_log_level($options, 'tcp_flags_log_level');
3283     $chain = 'PVEFW-logflags';
3284     if ( $std_chains->{$chain} ) {
3285         foreach my $r (@{$std_chains->{$chain}}) {
3286           $r->{log} = $loglevel;
3287         }
3288     }
3289
3290     foreach my $chain (keys %$std_chains) {
3291         ruleset_create_chain($ruleset, $chain);
3292         foreach my $rule (@{$std_chains->{$chain}}) {
3293             if (ref($rule)) {
3294                 ruleset_generate_rule($ruleset, $chain, $ipversion, $rule, 0);
3295             } else {
3296                 die "rule $rule as string - should not happen";
3297             }
3298         }
3299     }
3300 }
3301
3302 sub generate_ipset_chains {
3303     my ($ipset_ruleset, $clusterfw_conf, $fw_conf, $device_ips, $ipsets) = @_;
3304
3305     foreach my $ipset (keys %{$ipsets}) {
3306
3307         my $options = $ipsets->{$ipset};
3308
3309         if ($device_ips && $ipset =~ /^ipfilter-(net\d+)$/) {
3310             if (my $ips = $device_ips->{$1}) {
3311                 $options = [@$options, @$ips];
3312             }
3313         }
3314
3315         # remove duplicates
3316         my $nethash = {};
3317         foreach my $entry (@$options) {
3318             next if $entry->{errors}; # skip entries with errors
3319             eval {
3320                 my ($cidr, $ver);
3321                 if ($entry->{cidr} =~ m/^${ip_alias_pattern}$/) {
3322                     ($cidr, $ver) = resolve_alias($clusterfw_conf, $fw_conf, $entry->{cidr});
3323                 } else {
3324                     ($cidr, $ver) = parse_ip_or_cidr($entry->{cidr});
3325                 }
3326                 #http://backreference.org/2013/03/01/ipv6-address-normalization/
3327                 if ($ver == 6) {
3328                     # ip_compress_address takes an address only, no CIDR
3329                     my ($addr, $prefix_len) = ($cidr =~ m@^([^/]*)(/.*)?$@);
3330                     $cidr = lc(Net::IP::ip_compress_address($addr, 6));
3331                     $cidr .= $prefix_len if defined($prefix_len);
3332                     $cidr =~ s|/128$||;
3333                 } else {
3334                     $cidr =~ s|/32$||;
3335                 }
3336
3337                 $nethash->{$ver}->{$cidr} = { cidr => $cidr, nomatch => $entry->{nomatch} };
3338             };
3339             warn $@ if $@;
3340         }
3341
3342         foreach my $ipversion (4, 6) {
3343             my $data = $nethash->{$ipversion};
3344
3345             my $name = compute_ipset_chain_name($fw_conf->{vmid}, $ipset, $ipversion);
3346
3347             my $hashsize = scalar(@$options);
3348             if ($hashsize <= 64) {
3349                 $hashsize = 64;
3350             } else {
3351                 $hashsize = round_powerof2($hashsize);
3352             }
3353
3354             my $family = $ipversion == "6" ? "inet6" : "inet";
3355
3356             $ipset_ruleset->{$name} = ["create $name hash:net family $family hashsize $hashsize maxelem $hashsize"];
3357
3358             foreach my $cidr (sort keys %$data) {
3359                 my $entry = $data->{$cidr};
3360
3361                 my $cmd = "add $name $cidr";
3362                 if ($entry->{nomatch}) {
3363                     if ($feature_ipset_nomatch) {
3364                         push @{$ipset_ruleset->{$name}}, "$cmd nomatch";
3365                     } else {
3366                         warn "ignore !$cidr - nomatch not supported by kernel\n";
3367                     }
3368                 } else {
3369                     push @{$ipset_ruleset->{$name}}, $cmd;
3370                 }
3371             }
3372         }
3373     }
3374 }
3375
3376 sub round_powerof2 {
3377     my ($int) = @_;
3378
3379     $int--;
3380     $int |= $int >> $_ foreach (1,2,4,8,16);
3381     return ++$int;
3382 }
3383
3384 my $set_global_log_ratelimit = sub {
3385     my $cluster_opts = shift;
3386
3387     $global_log_ratelimit = '--limit 1/sec';
3388     if (defined(my $log_rlimit = $cluster_opts->{log_ratelimit})) {
3389         my $ll_format = $cluster_option_properties->{log_ratelimit}->{format};
3390         my $limit = PVE::JSONSchema::parse_property_string($ll_format, $log_rlimit);
3391
3392         if ($limit->{enable}) {
3393             if (my $rate = $limit->{rate}) {
3394                 $global_log_ratelimit = "--limit $rate";
3395             }
3396             if (my $burst = $limit->{burst}) {
3397                 $global_log_ratelimit .= " --limit-burst $burst";
3398             }
3399         } else {
3400             $global_log_ratelimit = undef;
3401         }
3402     }
3403 };
3404
3405 sub load_clusterfw_conf {
3406     my ($filename) = @_;
3407
3408     $filename = $clusterfw_conf_filename if !defined($filename);
3409     my $empty_conf = {
3410         rules => [],
3411         options => {},
3412         aliases => {},
3413         groups => {},
3414         group_comments => {},
3415         ipset => {} ,
3416         ipset_comments => {},
3417     };
3418
3419     my $cluster_conf = generic_fw_config_parser($filename, $empty_conf, $empty_conf, 'cluster');
3420     $set_global_log_ratelimit->($cluster_conf->{options});
3421
3422     return $cluster_conf;
3423 }
3424
3425 sub save_clusterfw_conf {
3426     my ($cluster_conf) = @_;
3427
3428     my $raw = '';
3429
3430     my $options = $cluster_conf->{options};
3431     $raw .= &$format_options($options) if $options && scalar(keys %$options);
3432
3433     my $aliases = $cluster_conf->{aliases};
3434     $raw .= &$format_aliases($aliases) if $aliases && scalar(keys %$aliases);
3435
3436     $raw .= &$format_ipsets($cluster_conf) if $cluster_conf->{ipset};
3437  
3438     my $rules = $cluster_conf->{rules};
3439     if ($rules && scalar(@$rules)) {
3440         $raw .= "[RULES]\n\n";
3441         $raw .= &$format_rules($rules, 1);
3442         $raw .= "\n";
3443     }
3444
3445     if ($cluster_conf->{groups}) {
3446         foreach my $group (sort keys %{$cluster_conf->{groups}}) {
3447             my $rules = $cluster_conf->{groups}->{$group};
3448             if (my $comment = $cluster_conf->{group_comments}->{$group}) {
3449                 my $utf8comment = encode('utf8', $comment);
3450                 $raw .= "[group $group] # $utf8comment\n\n";
3451             } else {
3452                 $raw .= "[group $group]\n\n";
3453             }
3454
3455             $raw .= &$format_rules($rules, 0);
3456             $raw .= "\n";
3457         }
3458     }
3459
3460     if ($raw) {
3461         mkdir $pvefw_conf_dir;
3462         PVE::Tools::file_set_contents($clusterfw_conf_filename, $raw);
3463     } else {
3464         unlink $clusterfw_conf_filename;
3465     }
3466 }
3467
3468 sub load_hostfw_conf {
3469     my ($cluster_conf, $filename) = @_;
3470
3471     $filename = $hostfw_conf_filename if !defined($filename);
3472
3473     my $empty_conf = { rules => [], options => {}};
3474     return generic_fw_config_parser($filename, $cluster_conf, $empty_conf, 'host');
3475 }
3476
3477 sub save_hostfw_conf {
3478     my ($hostfw_conf) = @_;
3479
3480     my $raw = '';
3481
3482     my $options = $hostfw_conf->{options};
3483     $raw .= &$format_options($options) if $options && scalar(keys %$options);
3484
3485     my $rules = $hostfw_conf->{rules};
3486     if ($rules && scalar(@$rules)) {
3487         $raw .= "[RULES]\n\n";
3488         $raw .= &$format_rules($rules, 1);
3489         $raw .= "\n";
3490     }
3491
3492     if ($raw) {
3493         PVE::Tools::file_set_contents($hostfw_conf_filename, $raw);
3494     } else {
3495         unlink $hostfw_conf_filename;
3496     }
3497 }
3498
3499 sub compile {
3500     my ($cluster_conf, $hostfw_conf, $vmdata, $corosync_conf) = @_;
3501
3502     my $vmfw_configs;
3503
3504     # fixme: once we read standard chains from config this needs to be put in test/standard cases below
3505     $pve_std_chains = dclone($pve_std_chains_conf);
3506
3507     if ($vmdata) { # test mode
3508         my $testdir = $vmdata->{testdir} || die "no test directory specified";
3509         my $filename = "$testdir/cluster.fw";
3510         $cluster_conf = load_clusterfw_conf($filename);
3511
3512         $filename = "$testdir/host.fw";
3513         $hostfw_conf = load_hostfw_conf($cluster_conf, $filename);
3514
3515         $vmfw_configs = read_vm_firewall_configs($cluster_conf, $vmdata, $testdir);
3516     } else { # normal operation
3517         $cluster_conf = load_clusterfw_conf(undef) if !$cluster_conf;
3518
3519         $hostfw_conf = load_hostfw_conf($cluster_conf, undef) if !$hostfw_conf;
3520
3521         # cfs_update is handled by daemon or API
3522         $corosync_conf = PVE::Cluster::cfs_read_file("corosync.conf") if !$corosync_conf;
3523
3524         $vmdata = read_local_vm_config();
3525         $vmfw_configs = read_vm_firewall_configs($cluster_conf, $vmdata, undef);
3526     }
3527
3528     return ({},{},{},{}) if !$cluster_conf->{options}->{enable};
3529
3530     my $localnet;
3531     if ($cluster_conf->{aliases}->{local_network}) {
3532         $localnet = $cluster_conf->{aliases}->{local_network}->{cidr};
3533     } else {
3534         my $localnet_ver;
3535         ($localnet, $localnet_ver) = parse_ip_or_cidr(local_network() || '127.0.0.0/8');
3536
3537         $cluster_conf->{aliases}->{local_network} = {
3538             name => 'local_network', cidr => $localnet, ipversion => $localnet_ver };
3539     }
3540
3541     push @{$cluster_conf->{ipset}->{management}}, { cidr => $localnet };
3542
3543     my $ruleset = compile_iptables_filter($cluster_conf, $hostfw_conf, $vmfw_configs, $vmdata, $corosync_conf, 4);
3544     my $rulesetv6 = compile_iptables_filter($cluster_conf, $hostfw_conf, $vmfw_configs, $vmdata, $corosync_conf, 6);
3545     my $ebtables_ruleset = compile_ebtables_filter($cluster_conf, $hostfw_conf, $vmfw_configs, $vmdata);
3546     my $ipset_ruleset = compile_ipsets($cluster_conf, $vmfw_configs, $vmdata);
3547
3548     return ($ruleset, $ipset_ruleset, $rulesetv6, $ebtables_ruleset);
3549 }
3550
3551 sub compile_iptables_filter {
3552     my ($cluster_conf, $hostfw_conf, $vmfw_configs, $vmdata, $corosync_conf, $ipversion) = @_;
3553
3554     my $ruleset = {};
3555
3556     ruleset_create_chain($ruleset, "PVEFW-INPUT");
3557     ruleset_create_chain($ruleset, "PVEFW-OUTPUT");
3558
3559     ruleset_create_chain($ruleset, "PVEFW-FORWARD");
3560
3561     my $hostfw_options = $hostfw_conf->{options} || {};
3562
3563     # fixme: what log level should we use here?
3564     my $loglevel = get_option_log_level($hostfw_options, "log_level_out");
3565
3566     my $conn_allow_invalid = $hostfw_options->{nf_conntrack_allow_invalid} // 0;
3567     ruleset_chain_add_conn_filters($ruleset, "PVEFW-FORWARD", $conn_allow_invalid, "ACCEPT");
3568
3569     ruleset_create_chain($ruleset, "PVEFW-FWBR-IN&quo