remove a level of indirection on FW config parsing
[pve-firewall.git] / src / PVE / Firewall.pm
1 package PVE::Firewall;
2
3 use warnings;
4 use strict;
5
6 use POSIX;
7 use Data::Dumper;
8 use Digest::SHA;
9 use Socket qw(AF_INET6 inet_ntop inet_pton);
10 use PVE::INotify;
11 use PVE::Exception qw(raise raise_param_exc);
12 use PVE::JSONSchema qw(register_standard_option get_standard_option);
13 use PVE::Cluster;
14 use PVE::ProcFSTools;
15 use PVE::Tools qw($IPV4RE $IPV6RE);
16 use PVE::Network;
17 use PVE::SafeSyslog;
18 use File::Basename;
19 use File::Path;
20 use IO::File;
21 use Net::IP;
22 use PVE::Tools qw(run_command lock_file dir_glob_foreach);
23 use Encode;
24 use Storable qw(dclone);
25
26 my $hostfw_conf_filename = "/etc/pve/local/host.fw";
27 my $pvefw_conf_dir = "/etc/pve/firewall";
28 my $clusterfw_conf_filename = "$pvefw_conf_dir/cluster.fw";
29
30 # dynamically include PVE::QemuServer and PVE::LXC
31 # to avoid dependency problems
32 my $have_qemu_server;
33 eval {
34     require PVE::QemuServer;
35     require PVE::QemuConfig;
36     $have_qemu_server = 1;
37 };
38
39 my $have_lxc;
40 eval {
41     require PVE::LXC;
42     $have_lxc = 1;
43 };
44
45 my $pve_fw_status_dir = "/var/lib/pve-firewall";
46
47 mkdir $pve_fw_status_dir; # make sure this exists
48
49 my $security_group_name_pattern = '[A-Za-z][A-Za-z0-9\-\_]+';
50 my $ipset_name_pattern = '[A-Za-z][A-Za-z0-9\-\_]+';
51 our $ip_alias_pattern = '[A-Za-z][A-Za-z0-9\-\_]+';
52
53 my $max_alias_name_length = 64;
54 my $max_ipset_name_length = 64;
55 my $max_group_name_length = 18;
56
57 my $PROTOCOLS_WITH_PORTS = {
58     udp => 1,     17 => 1,
59     udplite => 1, 136 => 1,
60     tcp => 1,     6 => 1,
61     dccp => 1,    33 => 1,
62     sctp => 1,    132 => 1,
63 };
64
65 PVE::JSONSchema::register_format('IPorCIDR', \&pve_verify_ip_or_cidr);
66 sub pve_verify_ip_or_cidr {
67     my ($cidr, $noerr) = @_;
68
69     if ($cidr =~ m!^(?:$IPV6RE|$IPV4RE)(/(\d+))?$!) {
70         return $cidr if Net::IP->new($cidr);
71         return undef if $noerr;
72         die Net::IP::Error() . "\n";
73     }
74     return undef if $noerr;
75     die "value does not look like a valid IP address or CIDR network\n";
76 }
77
78 PVE::JSONSchema::register_format('IPorCIDRorAlias', \&pve_verify_ip_or_cidr_or_alias);
79 sub pve_verify_ip_or_cidr_or_alias {
80     my ($cidr, $noerr) = @_;
81
82     return if $cidr =~ m/^(?:$ip_alias_pattern)$/;
83
84     return pve_verify_ip_or_cidr($cidr, $noerr);
85 }
86
87 PVE::JSONSchema::register_standard_option('ipset-name', {
88     description => "IP set name.",
89     type => 'string',
90     pattern => $ipset_name_pattern,
91     minLength => 2,
92     maxLength => $max_ipset_name_length,
93 });
94
95 PVE::JSONSchema::register_standard_option('pve-fw-alias', {
96     description => "Alias name.",
97     type => 'string',
98     pattern => $ip_alias_pattern,
99     minLength => 2,
100     maxLength => $max_alias_name_length,
101 });
102
103 PVE::JSONSchema::register_standard_option('pve-fw-loglevel' => {
104     description => "Log level.",
105     type => 'string',
106     enum => ['emerg', 'alert', 'crit', 'err', 'warning', 'notice', 'info', 'debug', 'nolog'],
107     optional => 1,
108 });
109
110 PVE::JSONSchema::register_standard_option('pve-security-group-name', {
111     description => "Security Group name.",
112     type => 'string',
113     pattern => $security_group_name_pattern,
114     minLength => 2,
115     maxLength => $max_group_name_length,
116 });
117
118 my $feature_ipset_nomatch = 0;
119 eval  {
120     my (undef, undef, $release) = POSIX::uname();
121     if ($release =~ m/^(\d+)\.(\d+)\.\d+-/) {
122         my ($major, $minor) = ($1, $2);
123         $feature_ipset_nomatch = 1 if ($major > 3) ||
124             ($major == 3 && $minor >= 7);
125     }
126
127 };
128
129 my $nodename = PVE::INotify::nodename();
130
131 my $pve_fw_lock_filename = "/var/lock/pvefw.lck";
132
133 my $default_log_level = 'nolog'; # avoid logs by default
134 my $global_log_ratelimit = '--limit 1/sec';
135
136 my $log_level_hash = {
137     debug => 7,
138     info => 6,
139     notice => 5,
140     warning => 4,
141     err => 3,
142     crit => 2,
143     alert => 1,
144     emerg => 0,
145 };
146
147 my $verbose = 0;
148 sub set_verbose {
149     $verbose = shift;
150 }
151
152 # %rule
153 #
154 # name => optional
155 # enable => [0|1]
156 # action =>
157 # proto =>
158 # sport => port[,port[,port]].. or port:port
159 # dport => port[,port[,port]].. or port:port
160 # log => optional, loglevel
161 # logmsg => optional, logmsg - overwrites default
162 # iface_in => incomin interface
163 # iface_out => outgoing interface
164 # match => optional, overwrites generation of match
165 # target => optional, overwrites action
166
167 # we need to overwrite some macros for ipv6
168 my $pve_ipv6fw_macros = {
169     'Ping' => [
170         { action => 'PARAM', proto => 'icmpv6', dport => 'echo-request' },
171     ],
172     'NeighborDiscovery' => [
173         "IPv6 neighbor solicitation, neighbor and router advertisement",
174         { action => 'PARAM', proto => 'icmpv6', dport => 'router-solicitation' },
175         { action => 'PARAM', proto => 'icmpv6', dport => 'router-advertisement' },
176         { action => 'PARAM', proto => 'icmpv6', dport => 'neighbor-solicitation' },
177         { action => 'PARAM', proto => 'icmpv6', dport => 'neighbor-advertisement' },
178     ],
179     'DHCPv6' => [
180         "DHCPv6 traffic",
181         { action => 'PARAM', proto => 'udp', dport => '546:547', sport => '546:547' },
182     ],
183     'Trcrt' => [
184         { action => 'PARAM', proto => 'udp', dport => '33434:33524' },
185         { action => 'PARAM', proto => 'icmpv6', dport => 'echo-request' },
186     ],
187  };
188
189 # imported/converted from: /usr/share/shorewall/macro.*
190 my $pve_fw_macros = {
191     'Amanda' => [
192         "Amanda Backup",
193         { action => 'PARAM', proto => 'udp', dport => '10080' },
194         { action => 'PARAM', proto => 'tcp', dport => '10080' },
195     ],
196     'Auth' => [
197         "Auth (identd) traffic",
198         { action => 'PARAM', proto => 'tcp', dport => '113' },
199     ],
200     'BGP' => [
201         "Border Gateway Protocol traffic",
202         { action => 'PARAM', proto => 'tcp', dport => '179' },
203     ],
204     'BitTorrent' => [
205         "BitTorrent traffic for BitTorrent 3.1 and earlier",
206         { action => 'PARAM', proto => 'tcp', dport => '6881:6889' },
207         { action => 'PARAM', proto => 'udp', dport => '6881' },
208     ],
209     'BitTorrent32' => [
210         "BitTorrent traffic for BitTorrent 3.2 and later",
211         { action => 'PARAM', proto => 'tcp', dport => '6881:6999' },
212         { action => 'PARAM', proto => 'udp', dport => '6881' },
213     ],
214     'Ceph' => [
215         "Ceph Storage Cluster traffic (Ceph Monitors, OSD & MDS Deamons)",
216         { action => 'PARAM', proto => 'tcp', dport => '6789' },
217         { action => 'PARAM', proto => 'tcp', dport => '6800:7300' },
218     ],
219     'CVS' => [
220         "Concurrent Versions System pserver traffic",
221         { action => 'PARAM', proto => 'tcp', dport => '2401' },
222     ],
223     'Citrix' => [
224         "Citrix/ICA traffic (ICA, ICA Browser, CGP)",
225         { action => 'PARAM', proto => 'tcp', dport => '1494' },
226         { action => 'PARAM', proto => 'udp', dport => '1604' },
227         { action => 'PARAM', proto => 'tcp', dport => '2598' },
228     ],
229     'DAAP' => [
230         "Digital Audio Access Protocol traffic (iTunes, Rythmbox daemons)",
231         { action => 'PARAM', proto => 'tcp', dport => '3689' },
232         { action => 'PARAM', proto => 'udp', dport => '3689' },
233     ],
234     'DCC' => [
235         "Distributed Checksum Clearinghouse spam filtering mechanism",
236         { action => 'PARAM', proto => 'tcp', dport => '6277' },
237     ],
238     'DHCPfwd' => [
239         "Forwarded DHCP traffic",
240         { action => 'PARAM', proto => 'udp', dport => '67:68', sport => '67:68' },
241     ],
242     'DNS' => [
243         "Domain Name System traffic (upd and tcp)",
244         { action => 'PARAM', proto => 'udp', dport => '53' },
245         { action => 'PARAM', proto => 'tcp', dport => '53' },
246     ],
247     'Distcc' => [
248         "Distributed Compiler service",
249         { action => 'PARAM', proto => 'tcp', dport => '3632' },
250     ],
251     'FTP' => [
252         "File Transfer Protocol",
253         { action => 'PARAM', proto => 'tcp', dport => '21' },
254     ],
255     'Finger' => [
256         "Finger protocol (RFC 742)",
257         { action => 'PARAM', proto => 'tcp', dport => '79' },
258     ],
259     'GNUnet' => [
260         "GNUnet secure peer-to-peer networking traffic",
261         { action => 'PARAM', proto => 'tcp', dport => '2086' },
262         { action => 'PARAM', proto => 'udp', dport => '2086' },
263         { action => 'PARAM', proto => 'tcp', dport => '1080' },
264         { action => 'PARAM', proto => 'udp', dport => '1080' },
265     ],
266     'GRE' => [
267         "Generic Routing Encapsulation tunneling protocol",
268         { action => 'PARAM', proto => '47' },
269     ],
270     'Git' => [
271         "Git distributed revision control traffic",
272         { action => 'PARAM', proto => 'tcp', dport => '9418' },
273     ],
274     'HKP' => [
275         "OpenPGP HTTP keyserver protocol traffic",
276         { action => 'PARAM', proto => 'tcp', dport => '11371' },
277     ],
278     'HTTP' => [
279         "Hypertext Transfer Protocol (WWW)",
280         { action => 'PARAM', proto => 'tcp', dport => '80' },
281     ],
282     'HTTPS' => [
283         "Hypertext Transfer Protocol (WWW) over SSL",
284         { action => 'PARAM', proto => 'tcp', dport => '443' },
285     ],
286     'ICPV2' => [
287         "Internet Cache Protocol V2 (Squid) traffic",
288         { action => 'PARAM', proto => 'udp', dport => '3130' },
289     ],
290     'ICQ' => [
291         "AOL Instant Messenger traffic",
292         { action => 'PARAM', proto => 'tcp', dport => '5190' },
293     ],
294     'IMAP' => [
295         "Internet Message Access Protocol",
296         { action => 'PARAM', proto => 'tcp', dport => '143' },
297     ],
298     'IMAPS' => [
299         "Internet Message Access Protocol over SSL",
300         { action => 'PARAM', proto => 'tcp', dport => '993' },
301     ],
302     'IPIP' => [
303         "IPIP capsulation traffic",
304         { action => 'PARAM', proto => '94' },
305     ],
306     'IPsec' => [
307         "IPsec traffic",
308         { action => 'PARAM', proto => 'udp', dport => '500', sport => '500' },
309         { action => 'PARAM', proto => '50' },
310     ],
311     'IPsecah' => [
312         "IPsec authentication (AH) traffic",
313         { action => 'PARAM', proto => 'udp', dport => '500', sport => '500' },
314         { action => 'PARAM', proto => '51' },
315     ],
316     'IPsecnat' => [
317         "IPsec traffic and Nat-Traversal",
318         { action => 'PARAM', proto => 'udp', dport => '500' },
319         { action => 'PARAM', proto => 'udp', dport => '4500' },
320         { action => 'PARAM', proto => '50' },
321     ],
322     'IRC' => [
323         "Internet Relay Chat traffic",
324         { action => 'PARAM', proto => 'tcp', dport => '6667' },
325     ],
326     'Jetdirect' => [
327         "HP Jetdirect printing",
328         { action => 'PARAM', proto => 'tcp', dport => '9100' },
329     ],
330     'L2TP' => [
331         "Layer 2 Tunneling Protocol traffic",
332         { action => 'PARAM', proto => 'udp', dport => '1701' },
333     ],
334     'LDAP' => [
335         "Lightweight Directory Access Protocol traffic",
336         { action => 'PARAM', proto => 'tcp', dport => '389' },
337     ],
338     'LDAPS' => [
339         "Secure Lightweight Directory Access Protocol traffic",
340         { action => 'PARAM', proto => 'tcp', dport => '636' },
341     ],
342     'MSNP' => [
343         "Microsoft Notification Protocol",
344         { action => 'PARAM', proto => 'tcp', dport => '1863' },
345     ],
346     'MSSQL' => [
347         "Microsoft SQL Server",
348         { action => 'PARAM', proto => 'tcp', dport => '1433' },
349     ],
350     'Mail' => [
351         "Mail traffic (SMTP, SMTPS, Submission)",
352         { action => 'PARAM', proto => 'tcp', dport => '25' },
353         { action => 'PARAM', proto => 'tcp', dport => '465' },
354         { action => 'PARAM', proto => 'tcp', dport => '587' },
355     ],
356     'MDNS' => [
357         "Multicast DNS",
358         { action => 'PARAM', proto => 'udp', dport => '5353' },
359     ],
360     'Munin' => [
361         "Munin networked resource monitoring traffic",
362         { action => 'PARAM', proto => 'tcp', dport => '4949' },
363     ],
364     'MySQL' => [
365         "MySQL server",
366         { action => 'PARAM', proto => 'tcp', dport => '3306' },
367     ],
368     'NNTP' => [
369         "NNTP traffic (Usenet).",
370         { action => 'PARAM', proto => 'tcp', dport => '119' },
371     ],
372     'NNTPS' => [
373         "Encrypted NNTP traffic (Usenet)",
374         { action => 'PARAM', proto => 'tcp', dport => '563' },
375     ],
376     'NTP' => [
377         "Network Time Protocol (ntpd)",
378         { action => 'PARAM', proto => 'udp', dport => '123' },
379     ],
380     'OSPF' => [
381         "OSPF multicast traffic",
382         { action => 'PARAM', proto => '89' },
383     ],
384     'OpenVPN' => [
385         "OpenVPN traffic",
386         { action => 'PARAM', proto => 'udp', dport => '1194' },
387     ],
388     'PCA' => [
389         "Symantec PCAnywere (tm)",
390         { action => 'PARAM', proto => 'udp', dport => '5632' },
391         { action => 'PARAM', proto => 'tcp', dport => '5631' },
392     ],
393     'POP3' => [
394         "POP3 traffic",
395         { action => 'PARAM', proto => 'tcp', dport => '110' },
396     ],
397     'POP3S' => [
398         "Encrypted POP3 traffic",
399         { action => 'PARAM', proto => 'tcp', dport => '995' },
400     ],
401     'PPtP' => [
402         "Point-to-Point Tunneling Protocol",
403         { action => 'PARAM', proto => '47' },
404         { action => 'PARAM', proto => 'tcp', dport => '1723' },
405     ],
406     'Ping' => [
407         "ICMP echo request",
408         { action => 'PARAM', proto => 'icmp', dport => 'echo-request' },
409     ],
410     'PostgreSQL' => [
411         "PostgreSQL server",
412         { action => 'PARAM', proto => 'tcp', dport => '5432' },
413     ],
414     'Printer' => [
415         "Line Printer protocol printing",
416         { action => 'PARAM', proto => 'tcp', dport => '515' },
417     ],
418     'RDP' => [
419         "Microsoft Remote Desktop Protocol traffic",
420         { action => 'PARAM', proto => 'tcp', dport => '3389' },
421     ],
422     'RIP' => [
423         "Routing Information Protocol (bidirectional)",
424         { action => 'PARAM', proto => 'udp', dport => '520' },
425     ],
426     'RNDC' => [
427         "BIND remote management protocol",
428         { action => 'PARAM', proto => 'tcp', dport => '953' },
429     ],
430     'Razor' => [
431         "Razor Antispam System",
432         { action => 'PARAM', proto => 'tcp', dport => '2703' },
433     ],
434     'Rdate' => [
435         "Remote time retrieval (rdate)",
436         { action => 'PARAM', proto => 'tcp', dport => '37' },
437     ],
438     'Rsync' => [
439         "Rsync server",
440         { action => 'PARAM', proto => 'tcp', dport => '873' },
441     ],
442     'SANE' => [
443         "SANE network scanning",
444         { action => 'PARAM', proto => 'tcp', dport => '6566' },
445     ],
446     'SMB' => [
447         "Microsoft SMB traffic",
448         { action => 'PARAM', proto => 'udp', dport => '135,445' },
449         { action => 'PARAM', proto => 'udp', dport => '137:139' },
450         { action => 'PARAM', proto => 'udp', dport => '1024:65535', sport => '137' },
451         { action => 'PARAM', proto => 'tcp', dport => '135,139,445' },
452     ],
453     'SMBswat' => [
454         "Samba Web Administration Tool",
455         { action => 'PARAM', proto => 'tcp', dport => '901' },
456     ],
457     'SMTP' => [
458         "Simple Mail Transfer Protocol",
459         { action => 'PARAM', proto => 'tcp', dport => '25' },
460     ],
461     'SMTPS' => [
462         "Encrypted Simple Mail Transfer Protocol",
463         { action => 'PARAM', proto => 'tcp', dport => '465' },
464     ],
465     'SNMP' => [
466         "Simple Network Management Protocol",
467         { action => 'PARAM', proto => 'udp', dport => '161:162' },
468         { action => 'PARAM', proto => 'tcp', dport => '161' },
469     ],
470     'SPAMD' => [
471         "Spam Assassin SPAMD traffic",
472         { action => 'PARAM', proto => 'tcp', dport => '783' },
473     ],
474     'SSH' => [
475         "Secure shell traffic",
476         { action => 'PARAM', proto => 'tcp', dport => '22' },
477     ],
478     'SVN' => [
479         "Subversion server (svnserve)",
480         { action => 'PARAM', proto => 'tcp', dport => '3690' },
481     ],
482     'SixXS' => [
483         "SixXS IPv6 Deployment and Tunnel Broker",
484         { action => 'PARAM', proto => 'tcp', dport => '3874' },
485         { action => 'PARAM', proto => 'udp', dport => '3740' },
486         { action => 'PARAM', proto => '41' },
487         { action => 'PARAM', proto => 'udp', dport => '5072,8374' },
488     ],
489     'Squid' => [
490         "Squid web proxy traffic",
491         { action => 'PARAM', proto => 'tcp', dport => '3128' },
492     ],
493     'Submission' => [
494         "Mail message submission traffic",
495         { action => 'PARAM', proto => 'tcp', dport => '587' },
496     ],
497     'Syslog' => [
498         "Syslog protocol (RFC 5424) traffic",
499         { action => 'PARAM', proto => 'udp', dport => '514' },
500         { action => 'PARAM', proto => 'tcp', dport => '514' },
501     ],
502     'TFTP' => [
503         "Trivial File Transfer Protocol traffic",
504         { action => 'PARAM', proto => 'udp', dport => '69' },
505     ],
506     'Telnet' => [
507         "Telnet traffic",
508         { action => 'PARAM', proto => 'tcp', dport => '23' },
509     ],
510     'Telnets' => [
511         "Telnet over SSL",
512         { action => 'PARAM', proto => 'tcp', dport => '992' },
513     ],
514     'Time' => [
515         "RFC 868 Time protocol",
516         { action => 'PARAM', proto => 'tcp', dport => '37' },
517     ],
518     'Trcrt' => [
519         "Traceroute (for up to 30 hops) traffic",
520         { action => 'PARAM', proto => 'udp', dport => '33434:33524' },
521         { action => 'PARAM', proto => 'icmp', dport => 'echo-request' },
522     ],
523     'VNC' => [
524         "VNC traffic for VNC display's 0 - 99",
525         { action => 'PARAM', proto => 'tcp', dport => '5900:5999' },
526     ],
527     'VNCL' => [
528         "VNC traffic from Vncservers to Vncviewers in listen mode",
529         { action => 'PARAM', proto => 'tcp', dport => '5500' },
530     ],
531     'Web' => [
532         "WWW traffic (HTTP and HTTPS)",
533         { action => 'PARAM', proto => 'tcp', dport => '80' },
534         { action => 'PARAM', proto => 'tcp', dport => '443' },
535     ],
536     'Webcache' => [
537         "Web Cache/Proxy traffic (port 8080)",
538         { action => 'PARAM', proto => 'tcp', dport => '8080' },
539     ],
540     'Webmin' => [
541         "Webmin traffic",
542         { action => 'PARAM', proto => 'tcp', dport => '10000' },
543     ],
544     'Whois' => [
545         "Whois (nicname, RFC 3912) traffic",
546         { action => 'PARAM', proto => 'tcp', dport => '43' },
547     ],
548 };
549
550 my $pve_fw_parsed_macros;
551 my $pve_fw_macro_descr;
552 my $pve_fw_macro_ipversion = {};
553 my $pve_fw_preferred_macro_names = {};
554
555 my $FWACCEPTMARK_ON  = "0x80000000/0x80000000";
556 my $FWACCEPTMARK_OFF = "0x00000000/0x80000000";
557
558 my $pve_std_chains = {};
559 my $pve_std_chains_conf = {};
560 $pve_std_chains_conf->{4} = {
561     'PVEFW-SET-ACCEPT-MARK' => [
562         { target => "-j MARK --set-mark $FWACCEPTMARK_ON" },
563     ],
564     'PVEFW-DropBroadcast' => [
565         # same as shorewall 'Broadcast'
566         # simply DROP BROADCAST/MULTICAST/ANYCAST
567         # we can use this to reduce logging
568         { action => 'DROP', dsttype => 'BROADCAST' },
569         { action => 'DROP', dsttype => 'MULTICAST' },
570         { action => 'DROP', dsttype => 'ANYCAST' },
571         { action => 'DROP', dest => '224.0.0.0/4' },
572     ],
573     'PVEFW-reject' => [
574         # same as shorewall 'reject'
575         { action => 'DROP', dsttype => 'BROADCAST' },
576         { action => 'DROP', source => '224.0.0.0/4' },
577         { action => 'DROP', proto => 'icmp' },
578         { match => '-p tcp', target => '-j REJECT --reject-with tcp-reset' },
579         { match => '-p udp', target => '-j REJECT --reject-with icmp-port-unreachable' },
580         { match => '-p icmp', target => '-j REJECT --reject-with icmp-host-unreachable' },
581         { target => '-j REJECT --reject-with icmp-host-prohibited' },
582     ],
583     'PVEFW-Drop' => [
584         # same as shorewall 'Drop', which is equal to DROP,
585         # but REJECT/DROP some packages to reduce logging,
586         # and ACCEPT critical ICMP types
587         { action => 'PVEFW-reject',  proto => 'tcp', dport => '43' }, # REJECT 'auth'
588         # we are not interested in BROADCAST/MULTICAST/ANYCAST
589         { action => 'PVEFW-DropBroadcast' },
590         # ACCEPT critical ICMP types
591         { action => 'ACCEPT', proto => 'icmp', dport => 'fragmentation-needed' },
592         { action => 'ACCEPT', proto => 'icmp', dport => 'time-exceeded' },
593         # Drop packets with INVALID state
594         { action => 'DROP', match => '-m conntrack --ctstate INVALID', },
595         # Drop Microsoft SMB noise
596         { action => 'DROP', proto => 'udp', dport => '135,445' },
597         { action => 'DROP', proto => 'udp', dport => '137:139' },
598         { action => 'DROP', proto => 'udp', dport => '1024:65535', sport => 137 },
599         { action => 'DROP', proto => 'tcp', dport => '135,139,445' },
600         { action => 'DROP', proto => 'udp', dport => 1900 }, # UPnP
601         # Drop new/NotSyn traffic so that it doesn't get logged
602         { action => 'DROP', match => '-p tcp -m tcp ! --tcp-flags FIN,SYN,RST,ACK SYN' },
603         # Drop DNS replies
604         { action => 'DROP', proto => 'udp', sport => 53 },
605     ],
606     'PVEFW-Reject' => [
607         # same as shorewall 'Reject', which is equal to Reject,
608         # but REJECT/DROP some packages to reduce logging,
609         # and ACCEPT critical ICMP types
610         { action => 'PVEFW-reject',  proto => 'tcp', dport => '43' }, # REJECT 'auth'
611         # we are not interested in BROADCAST/MULTICAST/ANYCAST
612         { action => 'PVEFW-DropBroadcast' },
613         # ACCEPT critical ICMP types
614         { action => 'ACCEPT', proto => 'icmp', dport => 'fragmentation-needed' },
615         { action => 'ACCEPT', proto => 'icmp', dport => 'time-exceeded' },
616         # Drop packets with INVALID state
617         { action => 'DROP', match => '-m conntrack --ctstate INVALID', },
618         # Drop Microsoft SMB noise
619         { action => 'PVEFW-reject', proto => 'udp', dport => '135,445' },
620         { action => 'PVEFW-reject', proto => 'udp', dport => '137:139'},
621         { action => 'PVEFW-reject', proto => 'udp', dport => '1024:65535', sport => 137 },
622         { action => 'PVEFW-reject', proto => 'tcp', dport => '135,139,445' },
623         { action => 'DROP', proto => 'udp', dport => 1900 }, # UPnP
624         # Drop new/NotSyn traffic so that it doesn't get logged
625         { action => 'DROP', match => '-p tcp -m tcp ! --tcp-flags FIN,SYN,RST,ACK SYN' },
626         # Drop DNS replies
627         { action => 'DROP', proto => 'udp', sport => 53 },
628     ],
629     'PVEFW-tcpflags' => [
630         # same as shorewall tcpflags action.
631         # Packets arriving on this interface are checked for som illegal combinations of TCP flags
632         { match => '-p tcp -m tcp --tcp-flags FIN,SYN,RST,PSH,ACK,URG FIN,PSH,URG', target => '-g PVEFW-logflags' },
633         { match => '-p tcp -m tcp --tcp-flags FIN,SYN,RST,PSH,ACK,URG NONE', target => '-g PVEFW-logflags' },
634         { match => '-p tcp -m tcp --tcp-flags SYN,RST SYN,RST', target => '-g PVEFW-logflags' },
635         { match => '-p tcp -m tcp --tcp-flags FIN,SYN FIN,SYN', target => '-g PVEFW-logflags' },
636         { match => '-p tcp -m tcp --sport 0 --tcp-flags FIN,SYN,RST,ACK SYN', target => '-g PVEFW-logflags' },
637     ],
638     'PVEFW-smurfs' => [
639         # same as shorewall smurfs action
640         # Filter packets for smurfs (packets with a broadcast address as the source).
641         { match => '-s 0.0.0.0/32', target => '-j RETURN' }, # allow DHCP
642         { match => '-m addrtype --src-type BROADCAST', target => '-g PVEFW-smurflog' },
643         { match => '-s 224.0.0.0/4', target => '-g PVEFW-smurflog' },
644     ],
645     'PVEFW-smurflog' => [
646         { action => 'DROP', logmsg => 'DROP: ' },
647     ],
648     'PVEFW-logflags' => [
649         { action => 'DROP', logmsg => 'DROP: ' },
650     ],
651 };
652
653 $pve_std_chains_conf->{6} = {
654     'PVEFW-SET-ACCEPT-MARK' => [
655         { target => "-j MARK --set-mark $FWACCEPTMARK_ON" },
656     ],
657     'PVEFW-DropBroadcast' => [
658         # same as shorewall 'Broadcast'
659         # simply DROP BROADCAST/MULTICAST/ANYCAST
660         # we can use this to reduce logging
661         #{ action => 'DROP', dsttype => 'BROADCAST' }, #no broadcast in ipv6
662         # ipv6 addrtype does not work with kernel 2.6.32
663         #{ action => 'DROP', dsttype => 'MULTICAST' },
664         #{ action => 'DROP', dsttype => 'ANYCAST' },
665         { action => 'DROP', dest => 'ff00::/8' },
666         #{ action => 'DROP', dest => '224.0.0.0/4' },
667     ],
668     'PVEFW-reject' => [
669         # same as shorewall 'reject'
670         #{ action => 'DROP', dsttype => 'BROADCAST' },
671         #{ action => 'DROP', source => '224.0.0.0/4' },
672         { action => 'DROP', proto => 'icmpv6' },
673         { match => '-p tcp', target => '-j REJECT --reject-with tcp-reset' },
674         #"-p udp -j REJECT --reject-with icmp-port-unreachable",
675         #"-p icmp -j REJECT --reject-with icmp-host-unreachable",
676         #"-j REJECT --reject-with icmp-host-prohibited",
677     ],
678     'PVEFW-Drop' => [
679         # same as shorewall 'Drop', which is equal to DROP,
680         # but REJECT/DROP some packages to reduce logging,
681         # and ACCEPT critical ICMP types
682         { action => 'PVEFW-reject', proto => 'tcp', dport => '43' }, # REJECT 'auth'
683         # we are not interested in BROADCAST/MULTICAST/ANYCAST
684         { action => 'PVEFW-DropBroadcast' },
685         # ACCEPT critical ICMP types
686         { action => 'ACCEPT', proto => 'icmpv6', dport => 'destination-unreachable' },
687         { action => 'ACCEPT', proto => 'icmpv6', dport => 'time-exceeded' },
688         { action => 'ACCEPT', proto => 'icmpv6', dport => 'packet-too-big' },
689         # Drop packets with INVALID state
690         { action => 'DROP', match => '-m conntrack --ctstate INVALID', },
691         # Drop Microsoft SMB noise
692         { action => 'DROP', proto => 'udp', dport => '135,445' },
693         { action => 'DROP', proto => 'udp', dport => '137:139'},
694         { action => 'DROP', proto => 'udp', dport => '1024:65535', sport => 137 },
695         { action => 'DROP', proto => 'tcp', dport => '135,139,445' },
696         { action => 'DROP', proto => 'udp', dport => 1900 }, # UPnP
697         # Drop new/NotSyn traffic so that it doesn't get logged
698         { action => 'DROP', match => '-p tcp -m tcp ! --tcp-flags FIN,SYN,RST,ACK SYN' },
699         # Drop DNS replies
700         { action => 'DROP', proto => 'udp', sport => 53 },
701     ],
702     'PVEFW-Reject' => [
703         # same as shorewall 'Reject', which is equal to Reject,
704         # but REJECT/DROP some packages to reduce logging,
705         # and ACCEPT critical ICMP types
706         { action => 'PVEFW-reject',  proto => 'tcp', dport => '43' }, # REJECT 'auth'
707         # we are not interested in BROADCAST/MULTICAST/ANYCAST
708         { action => 'PVEFW-DropBroadcast' },
709         # ACCEPT critical ICMP types
710         { action => 'ACCEPT', proto => 'icmpv6', dport => 'destination-unreachable' },
711         { action => 'ACCEPT', proto => 'icmpv6', dport => 'time-exceeded' },
712         { action => 'ACCEPT', proto => 'icmpv6', dport => 'packet-too-big' },
713         # Drop packets with INVALID state
714         { action => 'DROP', match => '-m conntrack --ctstate INVALID', },
715         # Drop Microsoft SMB noise
716         { action => 'PVEFW-reject', proto => 'udp', dport => '135,445' },
717         { action => 'PVEFW-reject', proto => 'udp', dport => '137:139' },
718         { action => 'PVEFW-reject', proto => 'udp', dport => '1024:65535', sport => 137 },
719         { action => 'PVEFW-reject', proto => 'tcp', dport => '135,139,445' },
720         { action => 'DROP', proto => 'udp', dport => 1900 }, # UPnP
721         # Drop new/NotSyn traffic so that it doesn't get logged
722         { action => 'DROP', match => '-p tcp -m tcp ! --tcp-flags FIN,SYN,RST,ACK SYN' },
723         # Drop DNS replies
724         { action => 'DROP', proto => 'udp', sport => 53 },
725     ],
726     'PVEFW-tcpflags' => [
727         # same as shorewall tcpflags action.
728         # Packets arriving on this interface are checked for som illegal combinations of TCP flags
729         { match => '-p tcp -m tcp --tcp-flags FIN,SYN,RST,PSH,ACK,URG FIN,PSH,URG', target => '-g PVEFW-logflags' },
730         { match => '-p tcp -m tcp --tcp-flags FIN,SYN,RST,PSH,ACK,URG NONE', target => '-g PVEFW-logflags' },
731         { match => '-p tcp -m tcp --tcp-flags SYN,RST SYN,RST', target => '-g PVEFW-logflags' },
732         { match => '-p tcp -m tcp --tcp-flags FIN,SYN FIN,SYN', target => '-g PVEFW-logflags' },
733         { match => '-p tcp -m tcp --sport 0 --tcp-flags FIN,SYN,RST,ACK SYN', target => '-g PVEFW-logflags' },
734     ],
735     'PVEFW-logflags' => [
736         { action => 'DROP', logmsg => 'DROP: ' },
737     ],
738 };
739
740 # iptables -p icmp -h
741 my $icmp_type_names = {
742     any => 1,
743     'echo-reply' => 1,
744     'destination-unreachable' => 1,
745     'network-unreachable' => 1,
746     'host-unreachable' => 1,
747     'protocol-unreachable' => 1,
748     'port-unreachable' => 1,
749     'fragmentation-needed' => 1,
750     'source-route-failed' => 1,
751     'network-unknown' => 1,
752     'host-unknown' => 1,
753     'network-prohibited' => 1,
754     'host-prohibited' => 1,
755     'TOS-network-unreachable' => 1,
756     'TOS-host-unreachable' => 1,
757     'communication-prohibited' => 1,
758     'host-precedence-violation' => 1,
759     'precedence-cutoff' => 1,
760     'source-quench' => 1,
761     'redirect' => 1,
762     'network-redirect' => 1,
763     'host-redirect' => 1,
764     'TOS-network-redirect' => 1,
765     'TOS-host-redirect' => 1,
766     'echo-request' => 1,
767     'router-advertisement' => 1,
768     'router-solicitation' => 1,
769     'time-exceeded' => 1,
770     'ttl-zero-during-transit' => 1,
771     'ttl-zero-during-reassembly' => 1,
772     'parameter-problem' => 1,
773     'ip-header-bad' => 1,
774     'required-option-missing' => 1,
775     'timestamp-request' => 1,
776     'timestamp-reply' => 1,
777     'address-mask-request' => 1,
778     'address-mask-reply' => 1,
779 };
780
781 # ip6tables -p icmpv6 -h
782
783 my $icmpv6_type_names = {
784     'any' => 1,
785     'destination-unreachable' => 1,
786     'no-route' => 1,
787     'communication-prohibited' => 1,
788     'address-unreachable' => 1,
789     'port-unreachable' => 1,
790     'packet-too-big' => 1,
791     'time-exceeded' => 1,
792     'ttl-zero-during-transit' => 1,
793     'ttl-zero-during-reassembly' => 1,
794     'parameter-problem' => 1,
795     'bad-header' => 1,
796     'unknown-header-type' => 1,
797     'unknown-option' => 1,
798     'echo-request' => 1,
799     'echo-reply' => 1,
800     'router-solicitation' => 1,
801     'router-advertisement' => 1,
802     'neighbor-solicitation' => 1,
803     'neighbour-solicitation' => 1,
804     'neighbor-advertisement' => 1,
805     'neighbour-advertisement' => 1,
806     'redirect' => 1,
807 };
808
809 sub init_firewall_macros {
810
811     $pve_fw_parsed_macros = {};
812
813     my $parse = sub {
814         my ($k, $macro) = @_;
815         my $lc_name = lc($k);
816         $pve_fw_macro_ipversion->{$k} = 0;
817         while (!ref($macro->[0])) {
818             my $desc = shift @$macro;
819             if ($desc eq 'ipv4only') {
820                 $pve_fw_macro_ipversion->{$k} = 4;
821             } elsif ($desc eq 'ipv6only') {
822                 $pve_fw_macro_ipversion->{$k} = 6;
823             } else {
824                 $pve_fw_macro_descr->{$k} = $desc;
825             }
826         }
827         $pve_fw_preferred_macro_names->{$lc_name} = $k;
828         $pve_fw_parsed_macros->{$k} = $macro;
829     };
830
831     foreach my $k (keys %$pve_fw_macros) {
832         &$parse($k, $pve_fw_macros->{$k});
833     }
834
835     foreach my $k (keys %$pve_ipv6fw_macros) {
836         next if $pve_fw_parsed_macros->{$k};
837         &$parse($k, $pve_ipv6fw_macros->{$k});
838         $pve_fw_macro_ipversion->{$k} = 6;
839     }
840 }
841
842 init_firewall_macros();
843
844 sub get_macros {
845     return wantarray ? ($pve_fw_parsed_macros, $pve_fw_macro_descr): $pve_fw_parsed_macros;
846 }
847
848 my $etc_services;
849
850 sub get_etc_services {
851
852     return $etc_services if $etc_services;
853
854     my $filename = "/etc/services";
855
856     my $fh = IO::File->new($filename, O_RDONLY);
857     if (!$fh) {
858         warn "unable to read '$filename' - $!\n";
859         return {};
860     }
861
862     my $services = {};
863
864     while (my $line = <$fh>) {
865         chomp ($line);
866         next if $line =~m/^#/;
867         next if ($line =~m/^\s*$/);
868
869         if ($line =~ m!^(\S+)\s+(\S+)/(tcp|udp|sctp).*$!) {
870             $services->{byid}->{$2}->{name} = $1;
871             $services->{byid}->{$2}->{port} = $2;
872             $services->{byid}->{$2}->{$3} = 1;
873             $services->{byname}->{$1} = $services->{byid}->{$2};
874         }
875     }
876
877     close($fh);
878
879     $etc_services = $services;
880
881
882     return $etc_services;
883 }
884
885 sub parse_protocol_file {
886     my ($filename) = @_;
887
888     my $fh = IO::File->new($filename, O_RDONLY);
889     if (!$fh) {
890         warn "unable to read '$filename' - $!\n";
891         return {};
892     }
893
894     my $protocols = {};
895
896     while (my $line = <$fh>) {
897         chomp ($line);
898         next if $line =~m/^#/;
899         next if ($line =~m/^\s*$/);
900
901         if ($line =~ m!^(\S+)\s+(\d+)(?:\s+.*)?$!) {
902             $protocols->{byid}->{$2}->{name} = $1;
903             $protocols->{byname}->{$1} = $protocols->{byid}->{$2};
904         }
905     }
906
907     close($fh);
908
909     return $protocols;
910 }
911
912 my $etc_protocols;
913
914 sub get_etc_protocols {
915     return $etc_protocols if $etc_protocols;
916
917     my $protocols = parse_protocol_file('/etc/protocols');
918
919     # add special case for ICMP v6
920     $protocols->{byid}->{icmpv6}->{name} = "icmpv6";
921     $protocols->{byname}->{icmpv6} = $protocols->{byid}->{icmpv6};
922
923     $etc_protocols = $protocols;
924
925     return $etc_protocols;
926 }
927
928 my $etc_ethertypes;
929
930 sub get_etc_ethertypes {
931     $etc_ethertypes = parse_protocol_file('/etc/ethertypes')
932         if !$etc_ethertypes;
933     return $etc_ethertypes;
934 }
935
936 my $__local_network;
937
938 sub local_network {
939     my ($new_value) = @_;
940
941     $__local_network = $new_value if defined($new_value);
942
943     return $__local_network if defined($__local_network);
944
945     eval {
946         my $nodename = PVE::INotify::nodename();
947
948         my $ip = PVE::Cluster::remote_node_ip($nodename);
949
950         my $testip = Net::IP->new($ip);
951
952         my $isv6 = $testip->version == 6;
953         my $routes = $isv6 ? PVE::ProcFSTools::read_proc_net_ipv6_route()
954                            : PVE::ProcFSTools::read_proc_net_route();
955         foreach my $entry (@$routes) {
956             my $mask;
957             if ($isv6) {
958                 $mask = $entry->{prefix};
959                 next if !$mask; # skip the default route...
960             } else {
961                 $mask = $PVE::Network::ipv4_mask_hash_localnet->{$entry->{mask}};
962                 next if !defined($mask);
963             }
964             my $cidr = "$entry->{dest}/$mask";
965             my $testnet = Net::IP->new($cidr);
966             my $overlap = $testnet->overlaps($testip);
967             if ($overlap == $Net::IP::IP_B_IN_A_OVERLAP ||
968                 $overlap == $Net::IP::IP_IDENTICAL)
969             {
970                 $__local_network = $cidr;
971                 return;
972             }
973         }
974     };
975     warn $@ if $@;
976
977     return $__local_network;
978 }
979
980 # ipset names are limited to 31 characters,
981 # and we use '-v4' or '-v6' to indicate IP versions, 
982 # and we use '_swap' suffix for atomic update, 
983 # for example PVEFW-${VMID}-${ipset_name}_swap
984
985 my $max_iptables_ipset_name_length = 31 - length("PVEFW-") - length("_swap");
986
987 sub compute_ipset_chain_name {
988     my ($vmid, $ipset_name, $ipversion) = @_;
989
990     $vmid = 0 if !defined($vmid);
991
992     my $id = "$vmid-${ipset_name}-v$ipversion";
993
994     if (length($id) > $max_iptables_ipset_name_length) {
995         $id = PVE::Tools::fnv31a_hex($id);
996     }
997
998     return "PVEFW-$id";
999 }
1000
1001 sub compute_ipfilter_ipset_name {
1002     my ($iface) = @_;
1003
1004     return "ipfilter-$iface";
1005 }
1006
1007 sub parse_address_list {
1008     my ($str) = @_;
1009
1010     if ($str =~ m/^(\+)(\S+)$/) { # ipset ref
1011         die "ipset name too long\n" if length($str) > ($max_ipset_name_length + 1);
1012         return;
1013     }
1014
1015     if ($str =~ m/^${ip_alias_pattern}$/) {
1016         die "alias name too long\n" if length($str) > $max_alias_name_length;
1017         return;
1018     }
1019
1020     my $count = 0;
1021     my $iprange = 0;
1022     my $ipversion;
1023
1024     my @elements = split(/,/, $str);
1025     die "extraneous commas in list\n" if $str ne join(',', @elements);
1026     foreach my $elem (@elements) {
1027         $count++;
1028         my $ip = Net::IP->new($elem);
1029         if (!$ip) {
1030             my $err = Net::IP::Error();
1031             die "invalid IP address: $err\n";
1032         }
1033         $iprange = 1 if $elem =~ m/-/;
1034
1035         my $new_ipversion = Net::IP::ip_is_ipv6($ip->ip()) ? 6 : 4;
1036
1037         die "detected mixed ipv4/ipv6 addresses in address list '$str'\n"
1038             if $ipversion && ($new_ipversion != $ipversion);
1039
1040         $ipversion = $new_ipversion;
1041     }
1042
1043     die "you can't use a range in a list\n" if $iprange && $count > 1;
1044
1045     return $ipversion;
1046 }
1047
1048 sub parse_port_name_number_or_range {
1049     my ($str, $dport) = @_;
1050
1051     my $services = PVE::Firewall::get_etc_services();
1052     my $count = 0;
1053     my $icmp_port = 0;
1054
1055     my @elements = split(/,/, $str);
1056     die "extraneous commas in list\n" if $str ne join(',', @elements);
1057     foreach my $item (@elements) {
1058         if ($item =~ m/^([0-9]+):([0-9]+)$/) {
1059             $count += 2;
1060             my ($port1, $port2) = ($1, $2);
1061             die "invalid port '$port1'\n" if $port1 > 65535;
1062             die "invalid port '$port2'\n" if $port2 > 65535;
1063             die "backwards range '$port1:$port2' not allowed, did you mean '$port2:$port1'?\n" if $port1 > $port2;
1064         } elsif ($item =~ m/^([0-9]+)$/) {
1065             $count += 1;
1066             my $port = $1;
1067             die "invalid port '$port'\n" if $port > 65535;
1068         } else {
1069             if ($dport && $icmp_type_names->{$item}) {
1070                 $icmp_port = 1;
1071             } elsif ($dport && $icmpv6_type_names->{$item}) {
1072                 $icmp_port = 1;
1073             } else {
1074                 die "invalid port '$item'\n" if !$services->{byname}->{$item};
1075             }
1076         }
1077     }
1078
1079     die "ICPM ports not allowed in port range\n" if $icmp_port && $count > 0;
1080
1081     # I really don't like to use the word number here, but it's the only thing
1082     # that makes sense in a literal way. The range 1:100 counts as 2, not as
1083     # one and not as 100...
1084     die "too many entries in port list (> 15 numbers)\n"
1085         if $count > 15;
1086
1087     return (scalar(@elements) > 1);
1088 }
1089
1090 PVE::JSONSchema::register_format('pve-fw-sport-spec', \&pve_fw_verify_sport_spec);
1091 sub pve_fw_verify_sport_spec {
1092    my ($portstr) = @_;
1093
1094    parse_port_name_number_or_range($portstr, 0);
1095
1096    return $portstr;
1097 }
1098
1099 PVE::JSONSchema::register_format('pve-fw-dport-spec', \&pve_fw_verify_dport_spec);
1100 sub pve_fw_verify_dport_spec {
1101    my ($portstr) = @_;
1102
1103    parse_port_name_number_or_range($portstr, 1);
1104
1105    return $portstr;
1106 }
1107
1108 PVE::JSONSchema::register_format('pve-fw-addr-spec', \&pve_fw_verify_addr_spec);
1109 sub pve_fw_verify_addr_spec {
1110    my ($list) = @_;
1111
1112    parse_address_list($list);
1113
1114    return $list;
1115 }
1116
1117 PVE::JSONSchema::register_format('pve-fw-protocol-spec', \&pve_fw_verify_protocol_spec);
1118 sub pve_fw_verify_protocol_spec {
1119    my ($proto) = @_;
1120
1121    my $protocols = get_etc_protocols();
1122
1123    die "unknown protocol '$proto'\n" if $proto &&
1124        !(defined($protocols->{byname}->{$proto}) ||
1125          defined($protocols->{byid}->{$proto}));
1126
1127    return $proto;
1128 }
1129
1130
1131 # helper function for API
1132
1133 sub copy_opject_with_digest {
1134     my ($object) = @_;
1135
1136     my $sha = Digest::SHA->new('sha1');
1137
1138     my $res = {};
1139     foreach my $k (sort keys %$object) {
1140         my $v = $object->{$k};
1141         next if !defined($v);
1142         $res->{$k} = $v;
1143         $sha->add($k, ':', $v, "\n");
1144     }
1145
1146     my $digest = $sha->hexdigest;
1147
1148     $res->{digest} = $digest;
1149
1150     return wantarray ? ($res, $digest) : $res;
1151 }
1152
1153 sub copy_list_with_digest {
1154     my ($list) = @_;
1155
1156     my $sha = Digest::SHA->new('sha1');
1157
1158     my $res = [];
1159     foreach my $entry (@$list) {
1160         my $data = {};
1161         foreach my $k (sort keys %$entry) {
1162             my $v = $entry->{$k};
1163             next if !defined($v);
1164             $data->{$k} = $v;
1165             # Note: digest ignores refs ($rule->{errors})
1166             # since Digest::SHA expects a series of bytes,
1167             #  we have to encode the value here to prevent errors when
1168             #  using utf8 characters (eg. in comments)
1169             $sha->add($k, ':', encode_utf8($v), "\n") if !ref($v); ;
1170         }
1171         push @$res, $data;
1172     }
1173
1174     my $digest = $sha->hexdigest;
1175
1176     foreach my $entry (@$res) {
1177         $entry->{digest} = $digest;
1178     }
1179
1180     return wantarray ? ($res, $digest) : $res;
1181 }
1182
1183 our $cluster_option_properties = {
1184     enable => {
1185         description => "Enable or disable the firewall cluster wide.",
1186         type => 'integer',
1187         minimum => 0,
1188         optional => 1,
1189     },
1190     ebtables => {
1191         description => "Enable ebtables rules cluster wide.",
1192         type => 'boolean',
1193         default => 1,
1194         optional => 1,
1195     },
1196     policy_in => {
1197         description => "Input policy.",
1198         type => 'string',
1199         optional => 1,
1200         enum => ['ACCEPT', 'REJECT', 'DROP'],
1201     },
1202     policy_out => {
1203         description => "Output policy.",
1204         type => 'string',
1205         optional => 1,
1206         enum => ['ACCEPT', 'REJECT', 'DROP'],
1207     },
1208     log_ratelimit => {
1209         description => "Log ratelimiting settings",
1210         type => 'string', format => {
1211             enable => {
1212                 default_key => 1,
1213                 description => 'Enable or disable log rate limiting',
1214                 type => 'boolean',
1215                 default => '1',
1216             },
1217             rate => {
1218                 type => 'string',
1219                 description => 'Frequency with which the burst bucket gets refilled',
1220                 optional => 1,
1221                 pattern => '[1-9][0-9]*\/(second|minute|hour|day)',
1222                 format_description => 'rate',
1223                 default => '1/second',
1224             },
1225             burst => {
1226                 type => 'integer',
1227                 minimum => 0,
1228                 optional => 1,
1229                 description => 'Inital burst of packages which will get logged',
1230                 default => 5,
1231             },
1232         },
1233         optional => 1,
1234     },
1235 };
1236
1237 our $host_option_properties = {
1238     enable => {
1239         description => "Enable host firewall rules.",
1240         type => 'boolean',
1241         optional => 1,
1242     },
1243     log_level_in =>  get_standard_option('pve-fw-loglevel', {
1244         description => "Log level for incoming traffic." }),
1245     log_level_out =>  get_standard_option('pve-fw-loglevel', {
1246         description => "Log level for outgoing traffic." }),
1247     tcp_flags_log_level =>  get_standard_option('pve-fw-loglevel', {
1248         description => "Log level for illegal tcp flags filter." }),
1249     smurf_log_level =>  get_standard_option('pve-fw-loglevel', {
1250         description => "Log level for SMURFS filter." }),
1251     nosmurfs => {
1252         description => "Enable SMURFS filter.",
1253         type => 'boolean',
1254         optional => 1,
1255     },
1256     tcpflags => {
1257         description => "Filter illegal combinations of TCP flags.",
1258         type => 'boolean',
1259         optional => 1,
1260     },
1261     nf_conntrack_max => {
1262         description => "Maximum number of tracked connections.",
1263         type => 'integer',
1264         optional => 1,
1265         minimum => 32768,
1266     },
1267     nf_conntrack_tcp_timeout_established => {
1268         description => "Conntrack established timeout.",
1269         type => 'integer',
1270         optional => 1,
1271         minimum => 7875,
1272     },
1273     ndp => {
1274         description => "Enable NDP.",
1275         type => 'boolean',
1276         optional => 1,
1277     },
1278     nf_conntrack_allow_invalid => {
1279         description => "Allow invalid packets on connection tracking.",
1280         type => 'boolean',
1281         default => 0,
1282         optional => 1,
1283     },
1284     log_nf_conntrack => {
1285         description => "Enable logging of conntrack information.",
1286         type => 'boolean',
1287         default => 0,
1288         optional => 1
1289     },
1290 };
1291
1292 our $vm_option_properties = {
1293     enable => {
1294         description => "Enable/disable firewall rules.",
1295         type => 'boolean',
1296         optional => 1,
1297     },
1298     macfilter => {
1299         description => "Enable/disable MAC address filter.",
1300         type => 'boolean',
1301         optional => 1,
1302     },
1303     dhcp => {
1304         description => "Enable DHCP.",
1305         type => 'boolean',
1306         optional => 1,
1307     },
1308     ndp => {
1309         description => "Enable NDP.",
1310         type => 'boolean',
1311         optional => 1,
1312     },
1313     radv => {
1314         description => "Allow sending Router Advertisement.",
1315         type => 'boolean',
1316         optional => 1,
1317     },
1318     ipfilter => {
1319         description => "Enable default IP filters. " .
1320            "This is equivalent to adding an empty ipfilter-net<id> ipset " .
1321            "for every interface. Such ipsets implicitly contain sane default " .
1322            "restrictions such as restricting IPv6 link local addresses to " .
1323            "the one derived from the interface's MAC address. For containers " .
1324            "the configured IP addresses will be implicitly added.",
1325         type => 'boolean',
1326         optional => 1,
1327     },
1328     policy_in => {
1329         description => "Input policy.",
1330         type => 'string',
1331         optional => 1,
1332         enum => ['ACCEPT', 'REJECT', 'DROP'],
1333     },
1334     policy_out => {
1335         description => "Output policy.",
1336         type => 'string',
1337         optional => 1,
1338         enum => ['ACCEPT', 'REJECT', 'DROP'],
1339     },
1340     log_level_in =>  get_standard_option('pve-fw-loglevel', {
1341         description => "Log level for incoming traffic." }),
1342     log_level_out =>  get_standard_option('pve-fw-loglevel', {
1343         description => "Log level for outgoing traffic." }),
1344
1345 };
1346
1347
1348 my $addr_list_descr = "This can refer to a single IP address, an IP set ('+ipsetname') or an IP alias definition. You can also specify an address range like '20.34.101.207-201.3.9.99', or a list of IP addresses and networks (entries are separated by comma). Please do not mix IPv4 and IPv6 addresses inside such lists.";
1349
1350 my $port_descr = "You can use service names or simple numbers (0-65535), as defined in '/etc/services'. Port ranges can be specified with '\\d+:\\d+', for example '80:85', and you can use comma separated list to match several ports or ranges.";
1351
1352 my $rule_properties = {
1353     pos => {
1354         description => "Update rule at position <pos>.",
1355         type => 'integer',
1356         minimum => 0,
1357         optional => 1,
1358     },
1359     digest => get_standard_option('pve-config-digest'),
1360     type => {
1361         description => "Rule type.",
1362         type => 'string',
1363         optional => 1,
1364         enum => ['in', 'out', 'group'],
1365     },
1366     action => {
1367         description => "Rule action ('ACCEPT', 'DROP', 'REJECT') or security group name.",
1368         type => 'string',
1369         optional => 1,
1370         pattern => $security_group_name_pattern,
1371         maxLength => 20,
1372         minLength => 2,
1373     },
1374     macro => {
1375         description => "Use predefined standard macro.",
1376         type => 'string',
1377         optional => 1,
1378         maxLength => 128,
1379     },
1380     iface => get_standard_option('pve-iface', {
1381         description => "Network interface name. You have to use network configuration key names for VMs and containers ('net\\d+'). Host related rules can use arbitrary strings.",
1382         optional => 1
1383     }),
1384     source => {
1385         description => "Restrict packet source address. $addr_list_descr",
1386         type => 'string', format => 'pve-fw-addr-spec',
1387         optional => 1,
1388     },
1389     dest => {
1390         description => "Restrict packet destination address. $addr_list_descr",
1391         type => 'string', format => 'pve-fw-addr-spec',
1392         optional => 1,
1393     },
1394     proto => {
1395         description => "IP protocol. You can use protocol names ('tcp'/'udp') or simple numbers, as defined in '/etc/protocols'.",
1396         type => 'string', format => 'pve-fw-protocol-spec',
1397         optional => 1,
1398     },
1399     enable => {
1400         description => "Flag to enable/disable a rule.",
1401         type => 'integer',
1402         minimum => 0,
1403         optional => 1,
1404     },
1405     log => get_standard_option('pve-fw-loglevel', {
1406         description => "Log level for firewall rule.",
1407     }),
1408     sport => {
1409         description => "Restrict TCP/UDP source port. $port_descr",
1410         type => 'string', format => 'pve-fw-sport-spec',
1411         optional => 1,
1412     },
1413     dport => {
1414         description => "Restrict TCP/UDP destination port. $port_descr",
1415         type => 'string', format => 'pve-fw-dport-spec',
1416         optional => 1,
1417     },
1418     comment => {
1419         description => "Descriptive comment.",
1420         type => 'string',
1421         optional => 1,
1422     },
1423 };
1424
1425 sub add_rule_properties {
1426     my ($properties) = @_;
1427
1428     foreach my $k (keys %$rule_properties) {
1429         my $h = $rule_properties->{$k};
1430         # copy data, so that we can modify later without side effects
1431         foreach my $opt (keys %$h) { $properties->{$k}->{$opt} = $h->{$opt}; }
1432     }
1433
1434     return $properties;
1435 }
1436
1437 sub delete_rule_properties {
1438     my ($rule, $delete_str) = @_;
1439
1440     foreach my $opt (PVE::Tools::split_list($delete_str)) {
1441         raise_param_exc({ 'delete' => "no such property ('$opt')"})
1442             if !defined($rule_properties->{$opt});
1443         raise_param_exc({ 'delete' => "unable to delete required property '$opt'"})
1444             if $opt eq 'type' || $opt eq 'action';
1445         delete $rule->{$opt};
1446     }
1447
1448     return $rule;
1449 }
1450
1451 my $apply_macro = sub {
1452     my ($macro_name, $param, $verify, $ipversion) = @_;
1453
1454     my $macro_rules = $pve_fw_parsed_macros->{$macro_name};
1455     die "unknown macro '$macro_name'\n" if !$macro_rules; # should not happen
1456
1457     if ($ipversion && ($ipversion == 6) && $pve_ipv6fw_macros->{$macro_name}) {
1458         $macro_rules = $pve_ipv6fw_macros->{$macro_name};
1459     }
1460
1461     # skip macros which are specific to another ipversion
1462     if ($ipversion && (my $required = $pve_fw_macro_ipversion->{$macro_name})) {
1463         return if $ipversion != $required;
1464     }
1465
1466     my $rules = [];
1467
1468     foreach my $templ (@$macro_rules) {
1469         my $rule = {};
1470         my $param_used = {};
1471         foreach my $k (keys %$templ) {
1472             my $v = $templ->{$k};
1473             if ($v eq 'PARAM') {
1474                 $v = $param->{$k};
1475                 $param_used->{$k} = 1;
1476             } elsif ($v eq 'DEST') {
1477                 $v = $param->{dest};
1478                 $param_used->{dest} = 1;
1479             } elsif ($v eq 'SOURCE') {
1480                 $v = $param->{source};
1481                 $param_used->{source} = 1;
1482             }
1483
1484             if (!defined($v)) {
1485                 my $msg = "missing parameter '$k' in macro '$macro_name'";
1486                 raise_param_exc({ macro => $msg }) if $verify;
1487                 die "$msg\n";
1488             }
1489             $rule->{$k} = $v;
1490         }
1491         foreach my $k (keys %$param) {
1492             next if $k eq 'macro';
1493             next if !defined($param->{$k});
1494             next if $param_used->{$k};
1495             if (defined($rule->{$k})) {
1496                 if ($rule->{$k} ne $param->{$k}) {
1497                     my $msg = "parameter '$k' already define in macro (value = '$rule->{$k}')";
1498                     raise_param_exc({ $k => $msg }) if $verify;
1499                     die "$msg\n";
1500                 }
1501             } else {
1502                 $rule->{$k} = $param->{$k};
1503             }
1504         }
1505         push @$rules, $rule;
1506     }
1507
1508     return $rules;
1509 };
1510
1511 my $rule_env_iface_lookup = {
1512     'ct' => 1,
1513     'vm' => 1,
1514     'group' => 0,
1515     'cluster' => 1,
1516     'host' => 1,
1517 };
1518
1519 sub verify_rule {
1520     my ($rule, $cluster_conf, $fw_conf, $rule_env, $noerr) = @_;
1521
1522     my $allow_groups = $rule_env eq 'group' ? 0 : 1;
1523
1524     my $allow_iface = $rule_env_iface_lookup->{$rule_env};
1525     die "unknown rule_env '$rule_env'\n" if !defined($allow_iface); # should not happen
1526
1527     my $errors = $rule->{errors} || {};
1528
1529     my $error_count = 0;
1530
1531     my $add_error = sub {
1532         my ($param, $msg)  = @_;
1533         chomp $msg;
1534         raise_param_exc({ $param => $msg }) if !$noerr;
1535         $error_count++;
1536         $errors->{$param} = $msg if !$errors->{$param};
1537     };
1538
1539     my $ipversion;
1540     my $set_ip_version = sub {
1541         my $vers = shift;
1542         if ($vers) {
1543             die "detected mixed ipv4/ipv6 adresses in rule\n"
1544                 if $ipversion && ($vers != $ipversion);
1545             $ipversion = $vers;
1546         }
1547     };
1548
1549     my $check_ipset_or_alias_property = sub {
1550         my ($name, $expected_ipversion) = @_;
1551
1552         if (my $value = $rule->{$name}) {
1553             if ($value =~ m/^\+/) {
1554                 if ($value =~ m/^\+(${ipset_name_pattern})$/) {
1555                     &$add_error($name, "no such ipset '$1'")
1556                         if !($cluster_conf->{ipset}->{$1} || ($fw_conf && $fw_conf->{ipset}->{$1}));
1557
1558                 } else {
1559                     &$add_error($name, "invalid ipset name '$value'");
1560                 }
1561             } elsif ($value =~ m/^${ip_alias_pattern}$/){
1562                 my $alias = lc($value);
1563                 &$add_error($name, "no such alias '$value'")
1564                     if !($cluster_conf->{aliases}->{$alias} || ($fw_conf && $fw_conf->{aliases}->{$alias}));
1565                 my $e = $fw_conf ? $fw_conf->{aliases}->{$alias} : undef;
1566                 $e = $cluster_conf->{aliases}->{$alias} if !$e && $cluster_conf;
1567
1568                 &$set_ip_version($e->{ipversion});
1569             }
1570         }
1571     };
1572
1573     my $type = $rule->{type};
1574     my $action = $rule->{action};
1575
1576     &$add_error('type', "missing property") if !$type;
1577     &$add_error('action', "missing property") if !$action;
1578
1579     if ($type) {
1580         if ($type eq  'in' || $type eq 'out') {
1581             &$add_error('action', "unknown action '$action'")
1582                 if $action && ($action !~ m/^(ACCEPT|DROP|REJECT)$/);
1583         } elsif ($type eq 'group') {
1584             &$add_error('type', "security groups not allowed")
1585                 if !$allow_groups;
1586             &$add_error('action', "invalid characters in security group name")
1587                 if $action && ($action !~ m/^${security_group_name_pattern}$/);
1588         } else {
1589             &$add_error('type', "unknown rule type '$type'");
1590         }
1591     }
1592
1593     if ($rule->{iface}) {
1594         &$add_error('type', "parameter -i not allowed for this rule type")
1595             if !$allow_iface;
1596         eval { PVE::JSONSchema::pve_verify_iface($rule->{iface}); };
1597         &$add_error('iface', $@) if $@;
1598         if ($rule_env eq 'vm' || $rule_env eq 'ct') {
1599             &$add_error('iface', "value does not match the regex pattern 'net\\d+'")
1600                 if $rule->{iface} !~  m/^net(\d+)$/;
1601         }
1602     }
1603
1604     if ($rule->{macro}) {
1605         if (my $preferred_name = $pve_fw_preferred_macro_names->{lc($rule->{macro})}) {
1606             $rule->{macro} = $preferred_name;
1607         } else {
1608             &$add_error('macro', "unknown macro '$rule->{macro}'");
1609         }
1610     }
1611
1612     if ($rule->{proto}) {
1613         eval { pve_fw_verify_protocol_spec($rule->{proto}); };
1614         &$add_error('proto', $@) if $@;
1615         &$set_ip_version(4) if $rule->{proto} eq 'icmp';
1616         &$set_ip_version(6) if $rule->{proto} eq 'icmpv6';
1617     }
1618
1619     if ($rule->{dport}) {
1620         eval { parse_port_name_number_or_range($rule->{dport}, 1); };
1621         &$add_error('dport', $@) if $@;
1622         my $proto = $rule->{proto};
1623         &$add_error('proto', "missing property - 'dport' requires this property")
1624             if !$proto;
1625         &$add_error('dport', "protocol '$proto' does not support ports")
1626             if !$PROTOCOLS_WITH_PORTS->{$proto} &&
1627                 $proto ne 'icmp' && $proto ne 'icmpv6'; # special cases
1628     }
1629
1630     if ($rule->{sport}) {
1631         eval { parse_port_name_number_or_range($rule->{sport}, 0); };
1632         &$add_error('sport', $@) if $@;
1633         my $proto = $rule->{proto};
1634         &$add_error('proto', "missing property - 'sport' requires this property")
1635             if !$proto;
1636         &$add_error('sport', "protocol '$proto' does not support ports")
1637             if !$PROTOCOLS_WITH_PORTS->{$proto};
1638     }
1639
1640     if ($rule->{source}) {
1641         eval { 
1642             my $source_ipversion = parse_address_list($rule->{source});
1643             &$set_ip_version($source_ipversion);
1644         };
1645         &$add_error('source', $@) if $@;
1646         &$check_ipset_or_alias_property('source', $ipversion);
1647     }
1648
1649     if ($rule->{dest}) {
1650         eval { 
1651             my $dest_ipversion = parse_address_list($rule->{dest}); 
1652             &$set_ip_version($dest_ipversion);
1653         };
1654         &$add_error('dest', $@) if $@;
1655         &$check_ipset_or_alias_property('dest', $ipversion);
1656     }
1657
1658     $rule->{ipversion} = $ipversion if $ipversion;
1659
1660     if ($rule->{macro} && !$error_count) {
1661         eval { &$apply_macro($rule->{macro}, $rule, 1, $ipversion); };
1662         if (my $err = $@) {
1663             if (ref($err) eq "PVE::Exception" && $err->{errors}) {
1664                 my $eh = $err->{errors};
1665                 foreach my $p (keys %$eh) {
1666                     &$add_error($p, $eh->{$p});
1667                 }
1668             } else {
1669                 &$add_error('macro', "$err");
1670             }
1671         }
1672     }
1673
1674     $rule->{errors} = $errors if $error_count;
1675
1676     return $rule;
1677 }
1678
1679 sub copy_rule_data {
1680     my ($rule, $param) = @_;
1681
1682     foreach my $k (keys %$rule_properties) {
1683         if (defined(my $v = $param->{$k})) {
1684             if ($v eq '' || $v eq '-') {
1685                 delete $rule->{$k};
1686             } else {
1687                 $rule->{$k} = $v;
1688             }
1689         }
1690     }
1691
1692     return $rule;
1693 }
1694
1695 sub rules_modify_permissions {
1696     my ($rule_env) = @_;
1697
1698     if ($rule_env eq 'host') {
1699         return {
1700             check => ['perm', '/nodes/{node}', [ 'Sys.Modify' ]],
1701         };
1702     } elsif ($rule_env eq 'cluster' || $rule_env eq 'group') {
1703         return {
1704             check => ['perm', '/', [ 'Sys.Modify' ]],
1705         };
1706     } elsif ($rule_env eq 'vm' || $rule_env eq 'ct') {
1707         return {
1708             check => ['perm', '/vms/{vmid}', [ 'VM.Config.Network' ]],
1709         }
1710     }
1711
1712     return undef;
1713 }
1714
1715 sub rules_audit_permissions {
1716     my ($rule_env) = @_;
1717
1718     if ($rule_env eq 'host') {
1719         return {
1720             check => ['perm', '/nodes/{node}', [ 'Sys.Audit' ]],
1721         };
1722     } elsif ($rule_env eq 'cluster' || $rule_env eq 'group') {
1723         return {
1724             check => ['perm', '/', [ 'Sys.Audit' ]],
1725         };
1726     } elsif ($rule_env eq 'vm' || $rule_env eq 'ct') {
1727         return {
1728             check => ['perm', '/vms/{vmid}', [ 'VM.Audit' ]],
1729         }
1730     }
1731
1732     return undef;
1733 }
1734
1735 # core functions
1736 my $bridge_firewall_enabled = 0;
1737
1738 sub enable_bridge_firewall {
1739
1740     return if $bridge_firewall_enabled; # only once
1741
1742     PVE::ProcFSTools::write_proc_entry("/proc/sys/net/bridge/bridge-nf-call-iptables", "1");
1743     PVE::ProcFSTools::write_proc_entry("/proc/sys/net/bridge/bridge-nf-call-ip6tables", "1");
1744
1745     # make sure syncookies are enabled (which is default on newer 3.X kernels anyways)
1746     PVE::ProcFSTools::write_proc_entry("/proc/sys/net/ipv4/tcp_syncookies", "1");
1747
1748     $bridge_firewall_enabled = 1;
1749 }
1750
1751 sub iptables_restore_cmdlist {
1752     my ($cmdlist) = @_;
1753
1754     run_command("/sbin/iptables-restore -n", input => $cmdlist, errmsg => "iptables_restore_cmdlist");
1755 }
1756
1757 sub ip6tables_restore_cmdlist {
1758     my ($cmdlist) = @_;
1759
1760     run_command("/sbin/ip6tables-restore -n", input => $cmdlist, errmsg => "iptables_restore_cmdlist");
1761 }
1762
1763 sub ipset_restore_cmdlist {
1764     my ($cmdlist) = @_;
1765
1766     run_command("/sbin/ipset restore", input => $cmdlist, errmsg => "ipset_restore_cmdlist");
1767 }
1768
1769 sub ebtables_restore_cmdlist {
1770     my ($cmdlist) = @_;
1771
1772     run_command("/sbin/ebtables-restore", input => $cmdlist, errmsg => "ebtables_restore_cmdlist");
1773 }
1774
1775 sub iptables_get_chains {
1776     my ($iptablescmd) = @_;
1777
1778     $iptablescmd = "iptables" if !$iptablescmd;
1779
1780     my $res = {};
1781
1782     # check what chains we want to track
1783     my $is_pvefw_chain = sub {
1784         my $name = shift;
1785
1786         return 1 if $name =~ m/^PVEFW-\S+$/;
1787
1788         return 1 if $name =~ m/^tap\d+i\d+-(?:IN|OUT)$/;
1789
1790         return 1 if $name =~ m/^veth\d+i\d+-(?:IN|OUT)$/;
1791
1792         return 1 if $name =~ m/^fwbr\d+(v\d+)?-(?:FW|IN|OUT|IPS)$/;
1793         return 1 if $name =~ m/^GROUP-(?:$security_group_name_pattern)-(?:IN|OUT)$/;
1794
1795         return undef;
1796     };
1797
1798     my $table = '';
1799
1800     my $hooks = {};
1801
1802     my $parser = sub {
1803         my $line = shift;
1804
1805         return if $line =~ m/^#/;
1806         return if $line =~ m/^\s*$/;
1807
1808         if ($line =~ m/^\*(\S+)$/) {
1809             $table = $1;
1810             return;
1811         }
1812
1813         return if $table ne 'filter';
1814
1815         if ($line =~ m/^:(\S+)\s/) {
1816             my $chain = $1;
1817             return if !&$is_pvefw_chain($chain);
1818             $res->{$chain} = "unknown";
1819         } elsif ($line =~ m/^-A\s+(\S+)\s.*--comment\s+\"PVESIG:(\S+)\"/) {
1820             my ($chain, $sig) = ($1, $2);
1821             return if !&$is_pvefw_chain($chain);
1822             $res->{$chain} = $sig;
1823         } elsif ($line =~ m/^-A\s+(INPUT|OUTPUT|FORWARD)\s+-j\s+PVEFW-\1$/) {
1824             $hooks->{$1} = 1;
1825         } else {
1826             # simply ignore the rest
1827             return;
1828         }
1829     };
1830
1831     run_command("/sbin/$iptablescmd-save", outfunc => $parser);
1832
1833     return wantarray ? ($res, $hooks) : $res;
1834 }
1835
1836 sub iptables_chain_digest {
1837     my ($rules) = @_;
1838     my $digest = Digest::SHA->new('sha1');
1839     foreach my $rule (@$rules) { # order is important
1840         $digest->add($rule);
1841     }
1842     return $digest->b64digest;
1843 }
1844
1845 sub ipset_chain_digest {
1846     my ($rules) = @_;
1847
1848     my $digest = Digest::SHA->new('sha1');
1849     foreach my $rule (sort @$rules) { # note: sorted
1850         $digest->add($rule);
1851     }
1852     return $digest->b64digest;
1853 }
1854
1855 sub ipset_get_chains {
1856
1857     my $res = {};
1858     my $chains = {};
1859
1860     my $parser = sub {
1861         my $line = shift;
1862
1863         return if $line =~ m/^#/;
1864         return if $line =~ m/^\s*$/;
1865         if ($line =~ m/^(?:\S+)\s(PVEFW-\S+)\s(?:\S+).*/) {
1866             my $chain = $1;
1867             $line =~ s/\s+$//; # delete trailing white space
1868             push @{$chains->{$chain}}, $line;
1869         } else {
1870             # simply ignore the rest
1871             return;
1872         }
1873     };
1874
1875     run_command("/sbin/ipset save", outfunc => $parser);
1876
1877     # compute digest for each chain
1878     foreach my $chain (keys %$chains) {
1879         $res->{$chain} = ipset_chain_digest($chains->{$chain});
1880     }
1881
1882     return $res;
1883 }
1884
1885 sub ebtables_get_chains {
1886
1887     my $res = {};
1888     my $chains = {};
1889     my $parser = sub {
1890         my $line = shift;
1891         return if $line =~ m/^#/;
1892         return if $line =~ m/^\s*$/;
1893         if ($line =~ m/^:(\S+)\s\S+$/) {
1894             # Make sure we know chains exist even if they're empty.
1895             $chains->{$1} //= [];
1896         } elsif ($line =~ m/^(?:\S+)\s(\S+)\s(?:\S+).*/) {
1897             my $chain = $1;
1898             $line =~ s/\s+$//;
1899             push @{$chains->{$chain}}, $line;
1900         } else {
1901             # simply ignore the rest
1902             return;
1903         }
1904     };
1905
1906     run_command("/sbin/ebtables-save", outfunc => $parser);
1907     # compute digest for each chain and store rules as well
1908     foreach my $chain (keys %$chains) {
1909         $res->{$chain}->{rules} = $chains->{$chain};
1910         $res->{$chain}->{sig} = iptables_chain_digest($chains->{$chain});
1911     }
1912     return $res;
1913 }
1914
1915 # substitude action of rule according to action hash
1916 sub rule_substitude_action {
1917     my ($rule, $actions) = @_;
1918
1919     if (my $action = $rule->{action}) {
1920         $rule->{action} = $actions->{$action} if defined($actions->{$action});
1921     }
1922 }
1923
1924 # generate a src or dst match
1925 # $dir(ection) is either d or s
1926 sub ipt_gen_src_or_dst_match {
1927     my ($adr, $dir, $ipversion, $cluster_conf, $fw_conf) = @_;
1928
1929     my $srcdst;
1930     if ($dir eq 's') {
1931         $srcdst = "src";
1932     } elsif ($dir eq 'd') {
1933         $srcdst = "dst";
1934     } else {
1935         die "ipt_gen_src_or_dst_match: invalid direction $dir \n";
1936     }
1937
1938     my $match;
1939     if ($adr =~ m/^\+/) {
1940         if ($adr =~ m/^\+(${ipset_name_pattern})$/) {
1941             my $name = $1;
1942             my $ipset_chain;
1943             if ($fw_conf && $fw_conf->{ipset}->{$name}) {
1944                 $ipset_chain = compute_ipset_chain_name($fw_conf->{vmid}, $name, $ipversion);
1945             } elsif ($cluster_conf && $cluster_conf->{ipset}->{$name}) {
1946                 $ipset_chain = compute_ipset_chain_name(0, $name, $ipversion);
1947             } else {
1948                 die "no such ipset '$name'\n";
1949             }
1950             $match = "-m set --match-set ${ipset_chain} ${srcdst}";
1951         } else {
1952             die "invalid security group name '$adr'\n";
1953         }
1954     } elsif ($adr =~ m/^${ip_alias_pattern}$/){
1955         my $alias = lc($adr);
1956         my $e = $fw_conf ? $fw_conf->{aliases}->{$alias} : undef;
1957         $e = $cluster_conf->{aliases}->{$alias} if !$e && $cluster_conf;
1958         die "no such alias '$adr'\n" if !$e;
1959         $match = "-${dir} $e->{cidr}";
1960     } elsif ($adr =~ m/\-/){
1961         $match = "-m iprange --${srcdst}-range $adr";
1962     } else {
1963         $match = "-${dir} $adr";
1964     }
1965
1966     return $match;
1967 }
1968
1969 # convert a %rule to an array of iptables commands
1970 sub ipt_rule_to_cmds {
1971     my ($rule, $chain, $ipversion, $cluster_conf, $fw_conf, $vmid) = @_;
1972
1973     die "ipt_rule_to_cmds unable to handle macro" if $rule->{macro}; #should not happen
1974
1975     my @match = ();
1976
1977     if (defined $rule->{match}) {
1978         push @match, $rule->{match};
1979     } else {
1980         push @match, "-i $rule->{iface_in}" if $rule->{iface_in};
1981         push @match, "-o $rule->{iface_out}" if $rule->{iface_out};
1982
1983         if ($rule->{source}) {
1984             push @match, ipt_gen_src_or_dst_match($rule->{source}, 's', $ipversion, $cluster_conf, $fw_conf);
1985         }
1986         if ($rule->{dest}) {
1987             push @match, ipt_gen_src_or_dst_match($rule->{dest}, 'd', $ipversion, $cluster_conf, $fw_conf);
1988         }
1989
1990         if (my $proto = $rule->{proto}) {
1991             push @match, "-p $proto";
1992
1993             my $multidport = defined($rule->{dport}) && parse_port_name_number_or_range($rule->{dport}, 1);
1994             my $multisport = defined($rule->{sport}) && parse_port_name_number_or_range($rule->{sport}, 0);
1995
1996             my $add_dport = sub {
1997                 return if !$rule->{dport};
1998
1999                 if ($proto eq 'icmp') {
2000                     # Note: we use dport to store --icmp-type
2001                     die "unknown icmp-type '$rule->{dport}'\n"
2002                         if $rule->{dport} !~ /^\d+$/ && !defined($icmp_type_names->{$rule->{dport}});
2003                     push @match, "-m icmp --icmp-type $rule->{dport}";
2004                 } elsif ($proto eq 'icmpv6') {
2005                     # Note: we use dport to store --icmpv6-type
2006                     die "unknown icmpv6-type '$rule->{dport}'\n"
2007                         if $rule->{dport} !~ /^\d+$/ && !defined($icmpv6_type_names->{$rule->{dport}});
2008                     push @match, "-m icmpv6 --icmpv6-type $rule->{dport}";
2009                 } elsif (!$PROTOCOLS_WITH_PORTS->{$proto}) {
2010                     die "protocol $proto does not have ports\n";
2011                 } elsif ($multidport) {
2012                     push @match, "--match multiport", "--dports $rule->{dport}";
2013                 } else {
2014                     push @match, "--dport $rule->{dport}";
2015                 }
2016             };
2017
2018             my $add_sport = sub {
2019                 return if !$rule->{sport};
2020
2021                 die "protocol $proto does not have ports\n"
2022                     if !$PROTOCOLS_WITH_PORTS->{$proto};
2023                 if ($multisport) {
2024                     push @match, "--match multiport", "--sports $rule->{sport}";
2025                 } else {
2026                     push @match, "--sport $rule->{sport}";
2027                 }
2028             };
2029
2030             # order matters - single port before multiport!
2031             $add_dport->() if $multisport;
2032             $add_sport->();
2033             $add_dport->() if !$multisport;
2034         } elsif ($rule->{dport} || $rule->{sport}) {
2035             die "destination port '$rule->{dport}', but no protocol specified\n" if $rule->{dport};
2036             die "source port '$rule->{sport}', but no protocol specified\n" if $rule->{sport};
2037         }
2038
2039         push @match, "-m addrtype --dst-type $rule->{dsttype}" if $rule->{dsttype};
2040     }
2041     my $matchstr = scalar(@match) ? join(' ', @match) : "";
2042
2043     my $targetstr;
2044     if (defined $rule->{target}) {
2045         $targetstr = $rule->{target};
2046     } else {
2047         my $action = (defined $rule->{action}) ? $rule->{action} : "";
2048         my $goto = 1 if $action eq 'PVEFW-SET-ACCEPT-MARK';
2049         $targetstr = ($goto) ? "-g $action" : "-j $action";
2050     }
2051
2052     my @iptcmds;
2053     my $log = $rule->{log};
2054     if (defined($log) && $log ne 'nolog') {
2055         my $loglevel = $log_level_hash->{$log};
2056         my $logaction = get_log_rule_base($chain, $vmid, $rule->{logmsg}, $loglevel);
2057         push @iptcmds, "-A $chain $matchstr $logaction";
2058     }
2059     push @iptcmds, "-A $chain $matchstr $targetstr";
2060     return @iptcmds;
2061 }
2062
2063 sub ruleset_generate_rule {
2064     my ($ruleset, $chain, $ipversion, $rule, $cluster_conf, $fw_conf, $vmid) = @_;
2065
2066     my $rules;
2067
2068     if ($rule->{macro}) {
2069         $rules = &$apply_macro($rule->{macro}, $rule, 0, $ipversion);
2070     } else {
2071         $rules = [ $rule ];
2072     }
2073
2074     # update all or nothing
2075     my @ipt_rule_cmds;
2076     foreach my $r (@$rules) {
2077         push @ipt_rule_cmds, ipt_rule_to_cmds($r, $chain, $ipversion, $cluster_conf, $fw_conf, $vmid);
2078     }
2079     foreach my $c (@ipt_rule_cmds) {
2080         ruleset_add_ipt_cmd($ruleset, $chain, $c);
2081     }
2082 }
2083
2084 sub ruleset_create_chain {
2085     my ($ruleset, $chain) = @_;
2086
2087     die "Invalid chain name '$chain' (28 char max)\n" if length($chain) > 28;
2088     die "chain name may not contain collons\n" if $chain =~ m/:/; # because of log format
2089
2090     die "chain '$chain' already exists\n" if $ruleset->{$chain};
2091
2092     $ruleset->{$chain} = [];
2093 }
2094
2095 sub ruleset_chain_exist {
2096     my ($ruleset, $chain) = @_;
2097
2098     return $ruleset->{$chain} ? 1 : undef;
2099 }
2100
2101 # add an iptables command (like generated by ipt_rule_to_cmds) to a chain
2102 sub ruleset_add_ipt_cmd {
2103    my ($ruleset, $chain, $iptcmd) = @_;
2104
2105    die "no such chain '$chain'\n" if !$ruleset->{$chain};
2106
2107    push @{$ruleset->{$chain}}, $iptcmd;
2108 }
2109
2110 sub ruleset_addrule {
2111     my ($ruleset, $chain, $match, $action, $log, $logmsg, $vmid) = @_;
2112
2113     die "no such chain '$chain'\n" if !$ruleset->{$chain};
2114
2115     if ($log) {
2116         my $loglevel = $log_level_hash->{$log};
2117         my $logaction = get_log_rule_base($chain, $vmid, $logmsg, $loglevel);
2118         push @{$ruleset->{$chain}}, "-A $chain $match $logaction";
2119     }
2120     # for stable ebtables digests avoid double-spaces to match ebtables-save output
2121     $match .= ' ' if length($match);
2122     push @{$ruleset->{$chain}}, "-A $chain ${match}$action";
2123 }
2124
2125 sub ruleset_insertrule {
2126    my ($ruleset, $chain, $match, $action, $log) = @_;
2127
2128    die "no such chain '$chain'\n" if !$ruleset->{$chain};
2129
2130    unshift @{$ruleset->{$chain}}, "-A $chain $match $action";
2131 }
2132
2133 sub get_log_rule_base {
2134     my ($chain, $vmid, $msg, $loglevel) = @_;
2135
2136     $vmid = 0 if !defined($vmid);
2137     $msg = "" if !defined($msg);
2138
2139     my $rlimit = '';
2140     if (defined($global_log_ratelimit)) {
2141         $rlimit = "-m limit $global_log_ratelimit ";
2142     }
2143
2144     # Note: we use special format for prefix to pass further
2145     # info to log daemon (VMID, LOGLEVEL and CHAIN)
2146     return "${rlimit}-j NFLOG --nflog-prefix \":$vmid:$loglevel:$chain: $msg\"";
2147 }
2148
2149 sub ruleset_add_chain_policy {
2150     my ($ruleset, $chain, $ipversion, $vmid, $policy, $loglevel, $accept_action) = @_;
2151
2152     if ($policy eq 'ACCEPT') {
2153
2154         my $rule = { action => 'ACCEPT' };
2155         rule_substitude_action($rule, { ACCEPT =>  $accept_action});
2156         ruleset_generate_rule($ruleset, $chain, $ipversion, $rule);
2157
2158     } elsif ($policy eq 'DROP') {
2159
2160         ruleset_addrule($ruleset, $chain, "", "-j PVEFW-Drop");
2161
2162         ruleset_addrule($ruleset, $chain, "", "-j DROP", $loglevel, "policy $policy: ", $vmid);
2163     } elsif ($policy eq 'REJECT') {
2164         ruleset_addrule($ruleset, $chain, "", "-j PVEFW-Reject");
2165
2166         ruleset_addrule($ruleset, $chain, "", "-g PVEFW-reject", $loglevel, "policy $policy: ", $vmid);
2167     } else {
2168         # should not happen
2169         die "internal error: unknown policy '$policy'";
2170     }
2171 }
2172
2173 sub ruleset_chain_add_ndp {
2174     my ($ruleset, $chain, $ipversion, $options, $direction, $accept) = @_;
2175     return if $ipversion != 6 || (defined($options->{ndp}) && !$options->{ndp});
2176
2177     ruleset_addrule($ruleset, $chain, "-p icmpv6 --icmpv6-type router-solicitation", $accept);
2178     if ($direction ne 'OUT' || $options->{radv}) {
2179         ruleset_addrule($ruleset, $chain, "-p icmpv6 --icmpv6-type router-advertisement", $accept);
2180     }
2181     ruleset_addrule($ruleset, $chain, "-p icmpv6 --icmpv6-type neighbor-solicitation", $accept);
2182     ruleset_addrule($ruleset, $chain, "-p icmpv6 --icmpv6-type neighbor-advertisement", $accept);
2183 }
2184
2185 sub ruleset_chain_add_conn_filters {
2186     my ($ruleset, $chain, $allow_invalid, $accept) = @_;
2187
2188     if (!$allow_invalid) {
2189         ruleset_addrule($ruleset, $chain, "-m conntrack --ctstate INVALID", "-j DROP");
2190     }
2191     ruleset_addrule($ruleset, $chain, "-m conntrack --ctstate RELATED,ESTABLISHED", "-j $accept");
2192 }
2193
2194 sub ruleset_chain_add_input_filters {
2195     my ($ruleset, $chain, $ipversion, $options, $cluster_conf, $loglevel) = @_;
2196
2197     if ($cluster_conf->{ipset}->{blacklist}){
2198         if (!ruleset_chain_exist($ruleset, "PVEFW-blacklist")) {
2199             ruleset_create_chain($ruleset, "PVEFW-blacklist");
2200             ruleset_addrule($ruleset, "PVEFW-blacklist", "", "-j DROP", $loglevel, "DROP: ", 0);
2201         }
2202         my $ipset_chain = compute_ipset_chain_name(0, 'blacklist', $ipversion);
2203         ruleset_addrule($ruleset, $chain, "-m set --match-set ${ipset_chain} src", "-j PVEFW-blacklist");
2204     }
2205
2206     if (!(defined($options->{nosmurfs}) && $options->{nosmurfs} == 0)) {
2207         if ($ipversion == 4) {
2208             ruleset_addrule($ruleset, $chain, "-m conntrack --ctstate INVALID,NEW", "-j PVEFW-smurfs");
2209         }
2210     }
2211
2212     if ($options->{tcpflags}) {
2213         ruleset_addrule($ruleset, $chain, "-p tcp", "-j PVEFW-tcpflags");
2214     }
2215 }
2216
2217 sub ruleset_create_vm_chain {
2218     my ($ruleset, $chain, $ipversion, $options, $macaddr, $ipfilter_ipset, $direction) = @_;
2219
2220     ruleset_create_chain($ruleset, $chain);
2221     my $accept = generate_nfqueue($options);
2222
2223     if (!(defined($options->{dhcp}) && $options->{dhcp} == 0)) {
2224         if ($ipversion == 4) {
2225             if ($direction eq 'OUT') {
2226                 ruleset_generate_rule($ruleset, $chain, $ipversion, 
2227                                       { action => 'PVEFW-SET-ACCEPT-MARK',
2228                                         proto => 'udp', sport => 68, dport => 67 });
2229             } else {
2230                 ruleset_generate_rule($ruleset, $chain, $ipversion,
2231                                       { action => 'ACCEPT',
2232                                         proto => 'udp', sport => 67, dport => 68 });
2233             }
2234         } elsif ($ipversion == 6) {
2235             if ($direction eq 'OUT') {
2236                 ruleset_generate_rule($ruleset, $chain, $ipversion,
2237                                       { action => 'PVEFW-SET-ACCEPT-MARK',
2238                                         proto => 'udp', sport => 546, dport => 547 });
2239             } else {
2240                 ruleset_generate_rule($ruleset, $chain, $ipversion,
2241                                       { action => 'ACCEPT',
2242                                         proto => 'udp', sport => 547, dport => 546 });
2243             }
2244         }
2245
2246     }
2247
2248     if ($direction eq 'OUT') {
2249         if (defined($macaddr) && !(defined($options->{macfilter}) && $options->{macfilter} == 0)) {
2250             ruleset_addrule($ruleset, $chain, "-m mac ! --mac-source $macaddr", "-j DROP");
2251         }
2252         if ($ipversion == 6 && !$options->{radv}) {
2253             ruleset_addrule($ruleset, $chain, "-p icmpv6 --icmpv6-type router-advertisement", "-j DROP");
2254         }
2255         if ($ipfilter_ipset) {
2256             ruleset_addrule($ruleset, $chain, "-m set ! --match-set $ipfilter_ipset src", "-j DROP");
2257         }
2258         ruleset_addrule($ruleset, $chain, "", "-j MARK --set-mark $FWACCEPTMARK_OFF"); # clear mark
2259     }
2260
2261     my $accept_action = $direction eq 'OUT' ? '-g PVEFW-SET-ACCEPT-MARK' : "-j $accept";
2262     ruleset_chain_add_ndp($ruleset, $chain, $ipversion, $options, $direction, $accept_action);
2263 }
2264
2265 sub ruleset_add_group_rule {
2266     my ($ruleset, $cluster_conf, $chain, $rule, $direction, $action, $ipversion) = @_;
2267
2268     my $group = $rule->{action};
2269     my $group_chain = "GROUP-$group-$direction";
2270     if(!ruleset_chain_exist($ruleset, $group_chain)){
2271         generate_group_rules($ruleset, $cluster_conf, $group, $ipversion);
2272     }
2273
2274     if ($direction eq 'OUT' && $rule->{iface_out}) {
2275         ruleset_addrule($ruleset, $chain, "-o $rule->{iface_out}", "-j $group_chain");
2276     } elsif ($direction eq 'IN' && $rule->{iface_in}) {
2277         ruleset_addrule($ruleset, $chain, "-i $rule->{iface_in}", "-j $group_chain");
2278     } else {
2279         ruleset_addrule($ruleset, $chain, "", "-j $group_chain");
2280     }
2281
2282     ruleset_addrule($ruleset, $chain, "-m mark --mark $FWACCEPTMARK_ON", "-j $action");
2283 }
2284
2285 sub ruleset_generate_vm_rules {
2286     my ($ruleset, $rules, $cluster_conf, $vmfw_conf, $chain, $netid, $direction, $options, $ipversion, $vmid) = @_;
2287
2288     my $lc_direction = lc($direction);
2289
2290     my $in_accept = generate_nfqueue($options);
2291
2292     foreach my $rule (@$rules) {
2293         next if $rule->{iface} && $rule->{iface} ne $netid;
2294         next if !$rule->{enable} || $rule->{errors};
2295         next if $rule->{ipversion} && ($rule->{ipversion} != $ipversion);
2296
2297         if ($rule->{type} eq 'group') {
2298             ruleset_add_group_rule($ruleset, $cluster_conf, $chain, $rule, $direction,
2299                                    $direction eq 'OUT' ? 'RETURN' : $in_accept, $ipversion);
2300         } else {
2301             next if $rule->{type} ne $lc_direction;
2302             eval {
2303                 $rule->{logmsg} = "$rule->{action}: ";
2304                 if ($direction eq 'OUT') {
2305                     rule_substitude_action($rule, { ACCEPT => "PVEFW-SET-ACCEPT-MARK", REJECT => "PVEFW-reject" });
2306                     ruleset_generate_rule($ruleset, $chain, $ipversion, $rule, $cluster_conf, $vmfw_conf, $vmid);
2307                 } else {
2308                     rule_substitude_action($rule, { ACCEPT => $in_accept , REJECT => "PVEFW-reject" });
2309                     ruleset_generate_rule($ruleset, $chain, $ipversion, $rule, $cluster_conf, $vmfw_conf, $vmid);
2310                 }
2311             };
2312             warn $@ if $@;
2313         }
2314     }
2315 }
2316
2317 sub generate_nfqueue {
2318     my ($options) = @_;
2319
2320     if ($options->{ips}) {
2321         my $action = "NFQUEUE";
2322         if ($options->{ips_queues} && $options->{ips_queues} =~ m/^(\d+)(:(\d+))?$/) {
2323             if (defined($3) && defined($1)) {
2324                 $action .= " --queue-balance $1:$3";
2325             } elsif (defined($1)) {
2326                 $action .= " --queue-num $1";
2327             }
2328         }
2329         $action .= " --queue-bypass" if $feature_ipset_nomatch; #need kernel 3.10
2330         return $action;
2331     } else {
2332         return "ACCEPT";
2333     }
2334 }
2335
2336 sub ruleset_generate_vm_ipsrules {
2337     my ($ruleset, $options, $direction, $iface) = @_;
2338
2339     if ($options->{ips} && $direction eq 'IN') {
2340         my $nfqueue = generate_nfqueue($options);
2341
2342         if (!ruleset_chain_exist($ruleset, "PVEFW-IPS")) {
2343             ruleset_create_chain($ruleset, "PVEFW-IPS");
2344         }
2345
2346         ruleset_addrule($ruleset, "PVEFW-IPS", "-m physdev --physdev-out $iface --physdev-is-bridged", "-j $nfqueue");
2347     }
2348 }
2349
2350 sub generate_tap_rules_direction {
2351     my ($ruleset, $cluster_conf, $iface, $netid, $macaddr, $vmfw_conf, $vmid, $direction, $ipversion) = @_;
2352
2353     my $lc_direction = lc($direction);
2354
2355     my $rules = $vmfw_conf->{rules};
2356
2357     my $options = $vmfw_conf->{options};
2358     my $loglevel = get_option_log_level($options, "log_level_${lc_direction}");
2359
2360     my $tapchain = "$iface-$direction";
2361
2362     my $ipfilter_name = compute_ipfilter_ipset_name($netid);
2363     my $ipfilter_ipset = compute_ipset_chain_name($vmid, $ipfilter_name, $ipversion)
2364         if $options->{ipfilter} || $vmfw_conf->{ipset}->{$ipfilter_name};
2365
2366     # create chain with mac and ip filter
2367     ruleset_create_vm_chain($ruleset, $tapchain, $ipversion, $options, $macaddr, $ipfilter_ipset, $direction);
2368
2369     if ($options->{enable}) {
2370         ruleset_generate_vm_rules($ruleset, $rules, $cluster_conf, $vmfw_conf, $tapchain, $netid, $direction, $options, $ipversion, $vmid);
2371
2372         ruleset_generate_vm_ipsrules($ruleset, $options, $direction, $iface);
2373
2374         # implement policy
2375         my $policy;
2376
2377         if ($direction eq 'OUT') {
2378             $policy = $options->{policy_out} || 'ACCEPT'; # allow everything by default
2379         } else {
2380             $policy = $options->{policy_in} || 'DROP'; # allow nothing by default
2381         }
2382
2383         my $accept = generate_nfqueue($options);
2384         my $accept_action = $direction eq 'OUT' ? "PVEFW-SET-ACCEPT-MARK" : $accept;
2385         ruleset_add_chain_policy($ruleset, $tapchain, $ipversion, $vmid, $policy, $loglevel, $accept_action);
2386     } else {
2387         my $accept_action = $direction eq 'OUT' ? "PVEFW-SET-ACCEPT-MARK" : 'ACCEPT';
2388         ruleset_add_chain_policy($ruleset, $tapchain, $ipversion, $vmid, 'ACCEPT', $loglevel, $accept_action);
2389     }
2390
2391     # plug the tap chain to bridge chain
2392     if ($direction eq 'IN') {
2393         ruleset_addrule($ruleset, "PVEFW-FWBR-IN",
2394                         "-m physdev --physdev-is-bridged --physdev-out $iface", "-j $tapchain", $loglevel, 'FWBR-IN: ', $vmid);
2395     } else {
2396         ruleset_addrule($ruleset, "PVEFW-FWBR-OUT",
2397                         "-m physdev --physdev-is-bridged --physdev-in $iface", "-j $tapchain", $loglevel, 'FWBR-OUT: ', $vmid);
2398     }
2399 }
2400
2401 sub enable_host_firewall {
2402     my ($ruleset, $hostfw_conf, $cluster_conf, $ipversion) = @_;
2403
2404     my $options = $hostfw_conf->{options};
2405     my $cluster_options = $cluster_conf->{options};
2406     my $rules = $hostfw_conf->{rules};
2407     my $cluster_rules = $cluster_conf->{rules};
2408
2409     # host inbound firewall
2410     my $chain = "PVEFW-HOST-IN";
2411     ruleset_create_chain($ruleset, $chain);
2412
2413     my $loglevel = get_option_log_level($options, "log_level_in");
2414
2415     ruleset_addrule($ruleset, $chain, "-i lo", "-j ACCEPT");
2416
2417     ruleset_chain_add_conn_filters($ruleset, $chain, 0, 'ACCEPT');
2418     ruleset_chain_add_ndp($ruleset, $chain, $ipversion, $options, 'IN', '-j RETURN');
2419     ruleset_chain_add_input_filters($ruleset, $chain, $ipversion, $options, $cluster_conf, $loglevel);
2420
2421     # we use RETURN because we need to check also tap rules
2422     my $accept_action = 'RETURN';
2423
2424     ruleset_addrule($ruleset, $chain, "-p igmp", "-j $accept_action"); # important for multicast
2425
2426     # add host rules first, so that cluster wide rules can be overwritten
2427     foreach my $rule (@$rules, @$cluster_rules) {
2428         next if !$rule->{enable} || $rule->{errors};
2429         next if $rule->{ipversion} && ($rule->{ipversion} != $ipversion);
2430
2431         $rule->{iface_in} = $rule->{iface} if $rule->{iface};
2432
2433         eval {
2434             if ($rule->{type} eq 'group') {
2435                 ruleset_add_group_rule($ruleset, $cluster_conf, $chain, $rule, 'IN', $accept_action, $ipversion);
2436             } elsif ($rule->{type} eq 'in') {
2437                 rule_substitude_action($rule, { ACCEPT => $accept_action, REJECT => "PVEFW-reject" });
2438                 ruleset_generate_rule($ruleset, $chain, $ipversion, $rule, $cluster_conf, $hostfw_conf, 0);
2439             }
2440         };
2441         warn $@ if $@;
2442         delete $rule->{iface_in};
2443     }
2444
2445     # allow standard traffic for management ipset (includes cluster network)
2446     my $mngmnt_ipset_chain = compute_ipset_chain_name(0, "management", $ipversion);
2447     my $mngmntsrc = "-m set --match-set ${mngmnt_ipset_chain} src";
2448     ruleset_addrule($ruleset, $chain, "$mngmntsrc -p tcp --dport 8006", "-j $accept_action");  # PVE API
2449     ruleset_addrule($ruleset, $chain, "$mngmntsrc -p tcp --dport 5900:5999", "-j $accept_action");  # PVE VNC Console
2450     ruleset_addrule($ruleset, $chain, "$mngmntsrc -p tcp --dport 3128", "-j $accept_action");  # SPICE Proxy
2451     ruleset_addrule($ruleset, $chain, "$mngmntsrc -p tcp --dport 22", "-j $accept_action");  # SSH
2452
2453     my $localnet = $cluster_conf->{aliases}->{local_network}->{cidr};
2454     my $localnet_ver = $cluster_conf->{aliases}->{local_network}->{ipversion};
2455
2456     # corosync
2457     if ($localnet && ($ipversion == $localnet_ver)) {
2458         my $corosync_rule = "-p udp --dport 5404:5405";
2459         ruleset_addrule($ruleset, $chain, "-s $localnet -d $localnet $corosync_rule", "-j $accept_action");
2460         ruleset_addrule($ruleset, $chain, "-s $localnet -m addrtype --dst-type MULTICAST $corosync_rule", "-j $accept_action");
2461     }
2462
2463     # implement input policy
2464     my $policy = $cluster_options->{policy_in} || 'DROP'; # allow nothing by default
2465     ruleset_add_chain_policy($ruleset, $chain, $ipversion, 0, $policy, $loglevel, $accept_action);
2466
2467     # host outbound firewall
2468     $chain = "PVEFW-HOST-OUT";
2469     ruleset_create_chain($ruleset, $chain);
2470
2471     $loglevel = get_option_log_level($options, "log_level_out");
2472
2473     ruleset_addrule($ruleset, $chain, "-o lo", "-j ACCEPT");
2474
2475     ruleset_chain_add_conn_filters($ruleset, $chain, 0, 'ACCEPT');
2476
2477     # we use RETURN because we may want to check other thigs later
2478     $accept_action = 'RETURN';
2479     ruleset_chain_add_ndp($ruleset, $chain, $ipversion, $options, 'OUT', "-j $accept_action");
2480
2481     ruleset_addrule($ruleset, $chain, "-p igmp", "-j $accept_action"); # important for multicast
2482
2483     # add host rules first, so that cluster wide rules can be overwritten
2484     foreach my $rule (@$rules, @$cluster_rules) {
2485         next if !$rule->{enable} || $rule->{errors};
2486         next if $rule->{ipversion} && ($rule->{ipversion} != $ipversion);
2487
2488         $rule->{iface_out} = $rule->{iface} if $rule->{iface};
2489         eval {
2490             $rule->{logmsg} = "$rule->{action}: ";
2491             if ($rule->{type} eq 'group') {
2492                 ruleset_add_group_rule($ruleset, $cluster_conf, $chain, $rule, 'OUT', $accept_action, $ipversion);
2493             } elsif ($rule->{type} eq 'out') {
2494                 rule_substitude_action($rule, { ACCEPT => $accept_action, REJECT => "PVEFW-reject" });
2495                 ruleset_generate_rule($ruleset, $chain, $ipversion, $rule, $cluster_conf, $hostfw_conf, 0);
2496             }
2497         };
2498         warn $@ if $@;
2499         delete $rule->{iface_out};
2500     }
2501
2502     # allow standard traffic on cluster network
2503     if ($localnet && ($ipversion == $localnet_ver)) {
2504         ruleset_addrule($ruleset, $chain, "-d $localnet -p tcp --dport 8006", "-j $accept_action");  # PVE API
2505         ruleset_addrule($ruleset, $chain, "-d $localnet -p tcp --dport 22", "-j $accept_action");  # SSH
2506         ruleset_addrule($ruleset, $chain, "-d $localnet -p tcp --dport 5900:5999", "-j $accept_action");  # PVE VNC Console
2507         ruleset_addrule($ruleset, $chain, "-d $localnet -p tcp --dport 3128", "-j $accept_action");  # SPICE Proxy
2508
2509         my $corosync_rule = "-p udp --dport 5404:5405";
2510         ruleset_addrule($ruleset, $chain, "-d $localnet $corosync_rule", "-j $accept_action");
2511         ruleset_addrule($ruleset, $chain, "-m addrtype --dst-type MULTICAST $corosync_rule", "-j $accept_action");
2512     }
2513
2514     # implement output policy
2515     $policy = $cluster_options->{policy_out} || 'ACCEPT'; # allow everything by default
2516     ruleset_add_chain_policy($ruleset, $chain, $ipversion, 0, $policy, $loglevel, $accept_action);
2517
2518     ruleset_addrule($ruleset, "PVEFW-OUTPUT", "", "-j PVEFW-HOST-OUT");
2519     ruleset_addrule($ruleset, "PVEFW-INPUT", "", "-j PVEFW-HOST-IN");
2520 }
2521
2522 sub generate_group_rules {
2523     my ($ruleset, $cluster_conf, $group, $ipversion) = @_;
2524
2525     my $rules = $cluster_conf->{groups}->{$group};
2526
2527     if (!$rules) {
2528         warn "no such security group '$group'\n";
2529         $rules = []; # create empty chain
2530     }
2531
2532     my $chain = "GROUP-${group}-IN";
2533
2534     ruleset_create_chain($ruleset, $chain);
2535     ruleset_addrule($ruleset, $chain, "", "-j MARK --set-mark $FWACCEPTMARK_OFF"); # clear mark
2536
2537     foreach my $rule (@$rules) {
2538         next if $rule->{type} ne 'in';
2539         next if !$rule->{enable} || $rule->{errors};
2540         next if $rule->{ipversion} && $rule->{ipversion} ne $ipversion;
2541         rule_substitude_action($rule, { ACCEPT => "PVEFW-SET-ACCEPT-MARK", REJECT => "PVEFW-reject" });
2542         ruleset_generate_rule($ruleset, $chain, $ipversion, $rule, $cluster_conf);
2543     }
2544
2545     $chain = "GROUP-${group}-OUT";
2546
2547     ruleset_create_chain($ruleset, $chain);
2548     ruleset_addrule($ruleset, $chain, "", "-j MARK --set-mark $FWACCEPTMARK_OFF"); # clear mark
2549
2550     foreach my $rule (@$rules) {
2551         next if $rule->{type} ne 'out';
2552         next if !$rule->{enable} || $rule->{errors};
2553         next if $rule->{ipversion} && $rule->{ipversion} ne $ipversion;
2554         # we use PVEFW-SET-ACCEPT-MARK (Instead of ACCEPT) because we need to
2555         # check also other tap rules later
2556         rule_substitude_action($rule, { ACCEPT => 'PVEFW-SET-ACCEPT-MARK', REJECT => "PVEFW-reject" });
2557         ruleset_generate_rule($ruleset, $chain, $ipversion, $rule, $cluster_conf);
2558     }
2559 }
2560
2561 my $MAX_NETS = 32;
2562 my $valid_netdev_names = {};
2563 for (my $i = 0; $i < $MAX_NETS; $i++)  {
2564     $valid_netdev_names->{"net$i"} = 1;
2565 }
2566
2567 sub get_mark_values {
2568     my ($value, $mask) = @_;
2569     $value = hex($value) if $value =~ /^0x/;
2570     $mask = hex($mask) if defined($mask) && $mask =~ /^0x/;
2571     $mask = 0xffffffff if !defined($mask);
2572     return ($value, $mask);
2573 }
2574
2575 sub parse_fw_rule {
2576     my ($prefix, $line, $cluster_conf, $fw_conf, $rule_env) = @_;
2577
2578     my $orig_line = $line;
2579
2580     my $rule = {};
2581
2582     # we can add single line comments to the end of the rule
2583     if ($line =~ s/#\s*(.*?)\s*$//) {
2584         $rule->{comment} = decode('utf8', $1);
2585     }
2586
2587     # we can disable a rule when prefixed with '|'
2588
2589     $rule->{enable} = $line =~ s/^\|// ? 0 : 1;
2590
2591     $line =~ s/^(\S+)\s+(\S+)\s*// ||
2592         die "unable to parse rule: $line\n";
2593
2594     $rule->{type} = lc($1);
2595     $rule->{action} = $2;
2596
2597     if ($rule->{type} eq  'in' || $rule->{type} eq 'out') {
2598         if ($rule->{action} =~ m/^(\S+)\((ACCEPT|DROP|REJECT)\)$/) {
2599             $rule->{macro} = $1;
2600             $rule->{action} = $2;
2601         }
2602     }
2603
2604     while (length($line)) {
2605         if ($line =~ s/^-i (\S+)\s*//) {
2606             $rule->{iface} = $1;
2607             next;
2608         }
2609
2610         last if $rule->{type} eq 'group';
2611
2612         if ($line =~ s/^-p (\S+)\s*//) {
2613             $rule->{proto} = $1;
2614             next;
2615         }
2616
2617         if ($line =~ s/^-dport (\S+)\s*//) {
2618             $rule->{dport} = $1;
2619             next;
2620         }
2621
2622         if ($line =~ s/^-sport (\S+)\s*//) {
2623             $rule->{sport} = $1;
2624             next;
2625         }
2626         if ($line =~ s/^-source (\S+)\s*//) {
2627             $rule->{source} = $1;
2628             next;
2629         }
2630         if ($line =~ s/^-dest (\S+)\s*//) {
2631             $rule->{dest} = $1;
2632             next;
2633         }
2634         if ($line =~ s/^-log (emerg|alert|crit|err|warning|notice|info|debug|nolog)\s*//) {
2635             $rule->{log} = $1;
2636             next;
2637         }
2638
2639         last;
2640     }
2641
2642     die "unable to parse rule parameters: $line\n" if length($line);
2643
2644     $rule = verify_rule($rule, $cluster_conf, $fw_conf, $rule_env, 1);
2645     if ($rule->{errors}) {
2646         # The verbose flag really means we're running from the CLI and want
2647         # output on the console - in the other case we really want such errors
2648         # to go into the syslog instead.
2649         my $log = $verbose ? sub { warn @_ } : sub { syslog(err => @_) };
2650         $log->("$prefix - errors in rule parameters: $orig_line\n");
2651         foreach my $p (keys %{$rule->{errors}}) {
2652             $log->("  $p: $rule->{errors}->{$p}\n");
2653         }
2654     }
2655
2656     return $rule;
2657 }
2658
2659 sub verify_ethertype {
2660     my ($value) = @_;
2661     my $types = get_etc_ethertypes();
2662     die "unknown ethernet protocol type: $value\n"
2663         if !defined($types->{byname}->{$value}) &&
2664            !defined($types->{byid}->{$value});
2665 }
2666
2667 sub parse_vmfw_option {
2668     my ($line) = @_;
2669
2670     my ($opt, $value);
2671
2672     my $loglevels = "emerg|alert|crit|err|warning|notice|info|debug|nolog";
2673
2674     if ($line =~ m/^(enable|dhcp|ndp|radv|macfilter|ipfilter|ips):\s*(0|1)\s*$/i) {
2675         $opt = lc($1);
2676         $value = int($2);
2677     } elsif ($line =~ m/^(log_level_in|log_level_out):\s*(($loglevels)\s*)?$/i) {
2678         $opt = lc($1);
2679         $value = $2 ? lc($3) : '';
2680     } elsif ($line =~ m/^(policy_(in|out)):\s*(ACCEPT|DROP|REJECT)\s*$/i) {
2681         $opt = lc($1);
2682         $value = uc($3);
2683     } elsif ($line =~ m/^(ips_queues):\s*((\d+)(:(\d+))?)\s*$/i) {
2684         $opt = lc($1);
2685         $value = $2;
2686     } elsif ($line =~ m/^(layer2_protocols):\s*(((\S+)[,]?)+)\s*$/i) {
2687         $opt = lc($1);
2688         $value = $2;
2689         verify_ethertype($_) foreach split(/\s*,\s*/, $value);
2690     } else {
2691         die "can't parse option '$line'\n"
2692     }
2693
2694     return ($opt, $value);
2695 }
2696
2697 sub parse_hostfw_option {
2698     my ($line) = @_;
2699
2700     my ($opt, $value);
2701
2702     my $loglevels = "emerg|alert|crit|err|warning|notice|info|debug|nolog";
2703
2704     if ($line =~ m/^(enable|nosmurfs|tcpflags|ndp|log_nf_conntrack|nf_conntrack_allow_invalid):\s*(0|1)\s*$/i) {
2705         $opt = lc($1);
2706         $value = int($2);
2707     } elsif ($line =~ m/^(log_level_in|log_level_out|tcp_flags_log_level|smurf_log_level):\s*(($loglevels)\s*)?$/i) {
2708         $opt = lc($1);
2709         $value = $2 ? lc($3) : '';
2710     } elsif ($line =~ m/^(nf_conntrack_max|nf_conntrack_tcp_timeout_established):\s*(\d+)\s*$/i) {
2711         $opt = lc($1);
2712         $value = int($2);
2713     } else {
2714         die "can't parse option '$line'\n"
2715     }
2716
2717     return ($opt, $value);
2718 }
2719
2720 sub parse_clusterfw_option {
2721     my ($line) = @_;
2722
2723     my ($opt, $value);
2724
2725     if ($line =~ m/^(enable):\s*(\d+)\s*$/i) {
2726         $opt = lc($1);
2727         $value = int($2);
2728         if (($value > 1) && ((time() - $value) > 60)) {
2729             $value = 0
2730         }
2731     } elsif ($line =~ m/^(ebtables):\s*(0|1)\s*$/i) {
2732         $opt = lc($1);
2733         $value = int($2);
2734     } elsif ($line =~ m/^(policy_(in|out)):\s*(ACCEPT|DROP|REJECT)\s*$/i) {
2735         $opt = lc($1);
2736         $value = uc($3);
2737     } elsif ($line =~ m/^(log_ratelimit):\s*(\S+)\s*$/) {
2738         $opt = lc($1);
2739         $value = $2;
2740     } else {
2741         die "can't parse option '$line'\n"
2742     }
2743
2744     return ($opt, $value);
2745 }
2746
2747 sub resolve_alias {
2748     my ($clusterfw_conf, $fw_conf, $cidr) = @_;
2749
2750     my $alias = lc($cidr);
2751     my $e = $fw_conf ? $fw_conf->{aliases}->{$alias} : undef;
2752     $e = $clusterfw_conf->{aliases}->{$alias} if !$e && $clusterfw_conf;
2753
2754     die "no such alias '$cidr'\n" if !$e;;
2755
2756     return wantarray ? ($e->{cidr}, $e->{ipversion}) : $e->{cidr};
2757 }
2758
2759 sub parse_ip_or_cidr {
2760     my ($cidr) = @_;
2761
2762     my $ipversion;
2763     
2764     if ($cidr =~ m!^(?:$IPV6RE)(/(\d+))?$!) {
2765         $cidr =~ s|/128$||;
2766         $ipversion = 6;
2767     } elsif ($cidr =~ m!^(?:$IPV4RE)(/(\d+))?$!) {
2768         $cidr =~ s|/32$||;
2769         $ipversion = 4;
2770     } else {
2771         die "value does not look like a valid IP address or CIDR network\n";
2772     }
2773
2774     return wantarray ? ($cidr, $ipversion) : $cidr;
2775 }
2776
2777 sub parse_alias {
2778     my ($line) = @_;
2779
2780     # we can add single line comments to the end of the line
2781     my $comment = decode('utf8', $1) if $line =~ s/\s*#\s*(.*?)\s*$//;
2782
2783     if ($line =~ m/^(\S+)\s(\S+)$/) {
2784         my ($name, $cidr) = ($1, $2);
2785         my $ipversion;
2786
2787         ($cidr, $ipversion) = parse_ip_or_cidr($cidr);
2788
2789         my $data = {
2790             name => $name,
2791             cidr => $cidr,
2792             ipversion => $ipversion,
2793         };
2794         $data->{comment} = $comment  if $comment;
2795         return $data;
2796     }
2797
2798     return undef;
2799 }
2800
2801 sub generic_fw_config_parser {
2802     my ($filename, $cluster_conf, $empty_conf, $rule_env) = @_;
2803
2804     my $fh = IO::File->new($filename, O_RDONLY);
2805     return {} if !$fh;
2806
2807     my $section;
2808     my $group;
2809
2810     my $res = $empty_conf;
2811
2812     while (defined(my $line = <$fh>)) {
2813         next if $line =~ m/^#/;
2814         next if $line =~ m/^\s*$/;
2815
2816         chomp $line;
2817
2818         my $linenr = $fh->input_line_number();
2819         my $prefix = "$filename (line $linenr)";
2820
2821         if ($empty_conf->{options} && ($line =~ m/^\[options\]$/i)) {
2822             $section = 'options';
2823             next;
2824         }
2825
2826         if ($empty_conf->{aliases} && ($line =~ m/^\[aliases\]$/i)) {
2827             $section = 'aliases';
2828             next;
2829         }
2830
2831         if ($empty_conf->{groups} && ($line =~ m/^\[group\s+(\S+)\]\s*(?:#\s*(.*?)\s*)?$/i)) {
2832             $section = 'groups';
2833             $group = lc($1);
2834             my $comment = $2;
2835             eval {
2836                 die "security group name too long\n" if length($group) > $max_group_name_length;
2837                 die "invalid security group name '$group'\n" if $group !~ m/^${security_group_name_pattern}$/;
2838             };
2839             if (my $err = $@) {
2840                 ($section, $group, $comment) = undef;
2841                 warn "$prefix: $err";
2842                 next;
2843             }
2844             
2845             $res->{$section}->{$group} = [];
2846             $res->{group_comments}->{$group} =  decode('utf8', $comment)
2847                 if $comment;
2848             next;
2849         }
2850
2851         if ($empty_conf->{rules} && ($line =~ m/^\[rules\]$/i)) {
2852             $section = 'rules';
2853             next;
2854         }
2855
2856         if ($empty_conf->{ipset} && ($line =~ m/^\[ipset\s+(\S+)\]\s*(?:#\s*(.*?)\s*)?$/i)) {
2857             $section = 'ipset';
2858             $group = lc($1);
2859             my $comment = $2;
2860             eval {      
2861                 die "ipset name too long\n" if length($group) > $max_ipset_name_length;
2862                 die "invalid ipset name '$group'\n" if $group !~ m/^${ipset_name_pattern}$/;
2863             };
2864             if (my $err = $@) {
2865                 ($section, $group, $comment) = undef;
2866                 warn "$prefix: $err";
2867                 next;
2868             }
2869
2870             $res->{$section}->{$group} = [];
2871             $res->{ipset_comments}->{$group} = decode('utf8', $comment)
2872                 if $comment;
2873             next;
2874         }
2875
2876         if (!$section) {
2877             warn "$prefix: skip line - no section\n";
2878             next;
2879         }
2880
2881         if ($section eq 'options') {
2882             eval {
2883                 my ($opt, $value);
2884                 if ($rule_env eq 'cluster') {
2885                     ($opt, $value) = parse_clusterfw_option($line);
2886                 } elsif ($rule_env eq 'host') {
2887                     ($opt, $value) = parse_hostfw_option($line);
2888                 } else {
2889                     ($opt, $value) = parse_vmfw_option($line);
2890                 }
2891                 $res->{options}->{$opt} = $value;
2892             };
2893             warn "$prefix: $@" if $@;
2894         } elsif ($section eq 'aliases') {
2895             eval {
2896                 my $data = parse_alias($line);
2897                 $res->{aliases}->{lc($data->{name})} = $data;
2898             };
2899             warn "$prefix: $@" if $@;
2900         } elsif ($section eq 'rules') {
2901             my $rule;
2902             eval { $rule = parse_fw_rule($prefix, $line, $cluster_conf, $res, $rule_env); };
2903             if (my $err = $@) {
2904                 warn "$prefix: $err";
2905                 next;
2906             }
2907             push @{$res->{$section}}, $rule;
2908         } elsif ($section eq 'groups') {
2909             my $rule;
2910             eval { $rule = parse_fw_rule($prefix, $line, $cluster_conf, undef, 'group'); };
2911             if (my $err = $@) {
2912                 warn "$prefix: $err";
2913                 next;
2914             }
2915             push @{$res->{$section}->{$group}}, $rule;
2916         } elsif ($section eq 'ipset') {
2917             # we can add single line comments to the end of the rule
2918             my $comment = decode('utf8', $1) if $line =~ s/#\s*(.*?)\s*$//;
2919
2920             $line =~ m/^(\!)?\s*(\S+)\s*$/;
2921             my $nomatch = $1;
2922             my $cidr = $2;
2923             my $errors;
2924
2925             if ($nomatch && !$feature_ipset_nomatch) {
2926                 $errors->{nomatch} = "nomatch not supported by kernel";
2927             }
2928
2929             eval { 
2930                 if ($cidr =~ m/^${ip_alias_pattern}$/) {
2931                     resolve_alias($cluster_conf, $res, $cidr); # make sure alias exists
2932                 } else {
2933                     $cidr = parse_ip_or_cidr($cidr);
2934                 }
2935             };
2936             if (my $err = $@) {
2937                 chomp $err;
2938                 $errors->{cidr} = $err;
2939             }
2940
2941             if ($cidr =~ m!/0+$!) {
2942                 $errors->{cidr} = "a zero prefix is not allowed in ipset entries\n";
2943             }
2944
2945             my $entry = { cidr => $cidr };
2946             $entry->{nomatch} = 1 if $nomatch;
2947             $entry->{comment} = $comment if $comment;
2948             $entry->{errors} =  $errors if $errors;
2949
2950             if ($verbose && $errors) {
2951                 warn "$prefix - errors in ipset '$group': $line\n";
2952                 foreach my $p (keys %{$errors}) {
2953                     warn "  $p: $errors->{$p}\n";
2954                 }
2955             }
2956
2957             push @{$res->{$section}->{$group}}, $entry;
2958         } else {
2959             warn "$prefix: skip line - unknown section\n";
2960             next;
2961         }
2962     }
2963
2964     return $res;
2965 }
2966
2967 sub run_locked {
2968     my ($code, @param) = @_;
2969
2970     my $timeout = 10;
2971
2972     my $res = lock_file($pve_fw_lock_filename, $timeout, $code, @param);
2973
2974     die $@ if $@;
2975
2976     return $res;
2977 }
2978
2979 sub read_local_vm_config {
2980
2981     my $qemu = {};
2982     my $lxc = {};
2983
2984     my $vmdata = { qemu => $qemu, lxc => $lxc };
2985
2986     my $vmlist = PVE::Cluster::get_vmlist();
2987     return $vmdata if !$vmlist || !$vmlist->{ids};
2988     my $ids = $vmlist->{ids};
2989
2990     foreach my $vmid (keys %$ids) {
2991         next if !$vmid; # skip VE0
2992         my $d = $ids->{$vmid};
2993         next if !$d->{node} || $d->{node} ne $nodename;
2994         next if !$d->{type};
2995         if ($d->{type} eq 'qemu') {
2996             if ($have_qemu_server) {
2997                 my $cfspath = PVE::QemuConfig->cfs_config_path($vmid);
2998                 if (my $conf = PVE::Cluster::cfs_read_file($cfspath)) {
2999                     $qemu->{$vmid} = $conf;
3000                 }
3001             }
3002         } elsif ($d->{type} eq 'lxc') {
3003             if ($have_lxc) {
3004                 my $cfspath = PVE::LXC::Config->cfs_config_path($vmid);
3005                 if (my $conf = PVE::Cluster::cfs_read_file($cfspath)) {
3006                     $lxc->{$vmid} = $conf;
3007                 }
3008             }
3009         }
3010     }
3011
3012     return $vmdata;
3013 };
3014
3015 sub load_vmfw_conf {
3016     my ($cluster_conf, $rule_env, $vmid, $dir) = @_;
3017
3018     $dir = $pvefw_conf_dir if !defined($dir);
3019     my $filename = "$dir/$vmid.fw";
3020
3021     my $empty_conf = {
3022         rules => [],
3023         options => {},
3024         aliases => {},
3025         ipset => {} ,
3026         ipset_comments => {},
3027     };
3028
3029     my $vmfw_conf = generic_fw_config_parser($filename, $cluster_conf, $empty_conf, $rule_env);
3030     $vmfw_conf->{vmid} = $vmid;
3031
3032     return $vmfw_conf;
3033 }
3034
3035 my $format_rules = sub {
3036     my ($rules, $allow_iface) = @_;
3037
3038     my $raw = '';
3039
3040     foreach my $rule (@$rules) {
3041         if ($rule->{type} eq  'in' || $rule->{type} eq 'out' || $rule->{type} eq 'group') {
3042             $raw .= '|' if defined($rule->{enable}) && !$rule->{enable};
3043             $raw .= uc($rule->{type});
3044             if ($rule->{macro}) {
3045                 $raw .= " $rule->{macro}($rule->{action})";
3046             } else {
3047                 $raw .= " " . $rule->{action};
3048             }
3049             if ($allow_iface && $rule->{iface}) {
3050                 $raw .= " -i $rule->{iface}";
3051             }
3052
3053             if ($rule->{type} ne  'group')  {
3054                 $raw .= " -source $rule->{source}" if $rule->{source};
3055                 $raw .= " -dest $rule->{dest}" if $rule->{dest};
3056                 $raw .= " -p $rule->{proto}" if $rule->{proto};
3057                 $raw .= " -dport $rule->{dport}" if $rule->{dport};
3058                 $raw .= " -sport $rule->{sport}" if $rule->{sport};
3059                 $raw .= " -log $rule->{log}" if $rule->{log};
3060             }
3061
3062             $raw .= " # " . encode('utf8', $rule->{comment})
3063                 if $rule->{comment} && $rule->{comment} !~ m/^\s*$/;
3064             $raw .= "\n";
3065         } else {
3066             die "unknown rule type '$rule->{type}'";
3067         }
3068     }
3069
3070     return $raw;
3071 };
3072
3073 my $format_options = sub {
3074     my ($options) = @_;
3075
3076     my $raw = '';
3077
3078     $raw .= "[OPTIONS]\n\n";
3079     foreach my $opt (keys %$options) {
3080         $raw .= "$opt: $options->{$opt}\n";
3081     }
3082     $raw .= "\n";
3083
3084     return $raw;
3085 };
3086
3087 my $format_aliases = sub {
3088     my ($aliases) = @_;
3089
3090     my $raw = '';
3091
3092     $raw .= "[ALIASES]\n\n";
3093     foreach my $k (keys %$aliases) {
3094         my $e = $aliases->{$k};
3095         $raw .= "$e->{name} $e->{cidr}";
3096         $raw .= " # " . encode('utf8', $e->{comment})
3097             if $e->{comment} && $e->{comment} !~ m/^\s*$/;
3098         $raw .= "\n";
3099     }
3100     $raw .= "\n";
3101
3102     return $raw;
3103 };
3104
3105 my $format_ipsets = sub {
3106     my ($fw_conf) = @_;
3107     
3108     my $raw = '';
3109
3110     foreach my $ipset (sort keys %{$fw_conf->{ipset}}) {
3111         if (my $comment = $fw_conf->{ipset_comments}->{$ipset}) {
3112             my $utf8comment = encode('utf8', $comment);
3113             $raw .= "[IPSET $ipset] # $utf8comment\n\n";
3114         } else {
3115             $raw .= "[IPSET $ipset]\n\n";
3116         }
3117         my $options = $fw_conf->{ipset}->{$ipset};
3118
3119         my $nethash = {};
3120         foreach my $entry (@$options) {
3121             $nethash->{$entry->{cidr}} = $entry;
3122         }
3123
3124         foreach my $cidr (sort keys %$nethash) {
3125             my $entry = $nethash->{$cidr};
3126             my $line = $entry->{nomatch} ? '!' : '';
3127             $line .= $entry->{cidr};
3128             $line .= " # " . encode('utf8', $entry->{comment})
3129                 if $entry->{comment} && $entry->{comment} !~ m/^\s*$/;
3130             $raw .= "$line\n";
3131         }
3132
3133         $raw .= "\n";
3134     }
3135
3136     return $raw;
3137 };
3138
3139 sub save_vmfw_conf {
3140     my ($vmid, $vmfw_conf) = @_;
3141
3142     my $raw = '';
3143
3144     my $options = $vmfw_conf->{options};
3145     $raw .= &$format_options($options) if $options && scalar(keys %$options);
3146
3147     my $aliases = $vmfw_conf->{aliases};
3148     $raw .= &$format_aliases($aliases) if $aliases && scalar(keys %$aliases);
3149
3150     $raw .= &$format_ipsets($vmfw_conf) if $vmfw_conf->{ipset};
3151
3152     my $rules = $vmfw_conf->{rules} || [];
3153     if ($rules && scalar(@$rules)) {
3154         $raw .= "[RULES]\n\n";
3155         $raw .= &$format_rules($rules, 1);
3156         $raw .= "\n";
3157     }
3158
3159     my $filename = "$pvefw_conf_dir/$vmid.fw";
3160     if ($raw) {
3161         mkdir $pvefw_conf_dir;
3162         PVE::Tools::file_set_contents($filename, $raw);
3163     } else {
3164         unlink $filename;
3165     }
3166 }
3167
3168 sub remove_vmfw_conf {
3169     my ($vmid) = @_;
3170
3171     my $vmfw_conffile = "$pvefw_conf_dir/$vmid.fw";
3172
3173     unlink $vmfw_conffile;
3174 }
3175
3176 sub clone_vmfw_conf {
3177     my ($vmid, $newid) = @_;
3178
3179     my $sourcevm_conffile = "$pvefw_conf_dir/$vmid.fw";
3180     my $clonevm_conffile = "$pvefw_conf_dir/$newid.fw";
3181
3182     if (-f $clonevm_conffile) {
3183         unlink $clonevm_conffile;
3184     }
3185     if (-f $sourcevm_conffile) {
3186         my $data = PVE::Tools::file_get_contents($sourcevm_conffile);
3187         PVE::Tools::file_set_contents($clonevm_conffile, $data);
3188     }
3189 }
3190
3191 sub read_vm_firewall_configs {
3192     my ($cluster_conf, $vmdata, $dir) = @_;
3193
3194     my $vmfw_configs = {};
3195
3196     foreach my $vmid (keys %{$vmdata->{qemu}}) {
3197         my $vmfw_conf = load_vmfw_conf($cluster_conf, 'vm', $vmid, $dir);
3198         next if !$vmfw_conf->{options}; # skip if file does not exists
3199         $vmfw_configs->{$vmid} = $vmfw_conf;
3200     }
3201     foreach my $vmid (keys %{$vmdata->{lxc}}) {
3202         my $vmfw_conf = load_vmfw_conf($cluster_conf, 'ct', $vmid, $dir);
3203         next if !$vmfw_conf->{options}; # skip if file does not exists
3204         $vmfw_configs->{$vmid} = $vmfw_conf;
3205     }
3206
3207     return $vmfw_configs;
3208 }
3209
3210 sub get_option_log_level {
3211     my ($options, $k) = @_;
3212
3213     my $v = $options->{$k};
3214     $v = $default_log_level if !defined($v);
3215
3216     return undef if $v eq '' || $v eq 'nolog';
3217
3218     return $v if defined($log_level_hash->{$v});
3219
3220     warn "unknown log level ($k = '$v')\n";
3221
3222     return undef;
3223 }
3224
3225 sub generate_std_chains {
3226     my ($ruleset, $options, $ipversion) = @_;
3227
3228     my $std_chains = $pve_std_chains->{$ipversion} || die "internal error";
3229
3230     my $loglevel = get_option_log_level($options, 'smurf_log_level');
3231     my $chain = 'PVEFW-smurflog';
3232     if ( $std_chains->{$chain} ) {
3233         foreach my $r (@{$std_chains->{$chain}}) {
3234           $r->{log} = $loglevel;
3235         }
3236     }
3237
3238     # same as shorewall logflags action.
3239     $loglevel = get_option_log_level($options, 'tcp_flags_log_level');
3240     $chain = 'PVEFW-logflags';
3241     if ( $std_chains->{$chain} ) {
3242         foreach my $r (@{$std_chains->{$chain}}) {
3243           $r->{log} = $loglevel;
3244         }
3245     }
3246
3247     foreach my $chain (keys %$std_chains) {
3248         ruleset_create_chain($ruleset, $chain);
3249         foreach my $rule (@{$std_chains->{$chain}}) {
3250             if (ref($rule)) {
3251                 ruleset_generate_rule($ruleset, $chain, $ipversion, $rule, 0);
3252             } else {
3253                 die "rule $rule as string - should not happen";
3254             }
3255         }
3256     }
3257 }
3258
3259 sub generate_ipset_chains {
3260     my ($ipset_ruleset, $clusterfw_conf, $fw_conf, $device_ips, $ipsets) = @_;
3261
3262     foreach my $ipset (keys %{$ipsets}) {
3263
3264         my $options = $ipsets->{$ipset};
3265
3266         if ($device_ips && $ipset =~ /^ipfilter-(net\d+)$/) {
3267             if (my $ips = $device_ips->{$1}) {
3268                 $options = [@$options, @$ips];
3269             }
3270         }
3271
3272         # remove duplicates
3273         my $nethash = {};
3274         foreach my $entry (@$options) {
3275             next if $entry->{errors}; # skip entries with errors
3276             eval {
3277                 my ($cidr, $ver);
3278                 if ($entry->{cidr} =~ m/^${ip_alias_pattern}$/) {
3279                     ($cidr, $ver) = resolve_alias($clusterfw_conf, $fw_conf, $entry->{cidr});
3280                 } else {
3281                     ($cidr, $ver) = parse_ip_or_cidr($entry->{cidr});
3282                 }
3283                 #http://backreference.org/2013/03/01/ipv6-address-normalization/
3284                 if ($ver == 6) {
3285                     # ip_compress_address takes an address only, no CIDR
3286                     my ($addr, $prefix_len) = ($cidr =~ m@^([^/]*)(/.*)?$@);
3287                     $cidr = lc(Net::IP::ip_compress_address($addr, 6));
3288                     $cidr .= $prefix_len if defined($prefix_len);
3289                     $cidr =~ s|/128$||;
3290                 } else {
3291                     $cidr =~ s|/32$||;
3292                 }
3293
3294                 $nethash->{$ver}->{$cidr} = { cidr => $cidr, nomatch => $entry->{nomatch} };
3295             };
3296             warn $@ if $@;
3297         }
3298
3299         foreach my $ipversion (4, 6) {
3300             my $data = $nethash->{$ipversion};
3301
3302             my $name = compute_ipset_chain_name($fw_conf->{vmid}, $ipset, $ipversion);
3303
3304             my $hashsize = scalar(@$options);
3305             if ($hashsize <= 64) {
3306                 $hashsize = 64;
3307             } else {
3308                 $hashsize = round_powerof2($hashsize);
3309             }
3310
3311             my $family = $ipversion == "6" ? "inet6" : "inet";
3312
3313             $ipset_ruleset->{$name} = ["create $name hash:net family $family hashsize $hashsize maxelem $hashsize"];
3314
3315             foreach my $cidr (sort keys %$data) {
3316                 my $entry = $data->{$cidr};
3317
3318                 my $cmd = "add $name $cidr";
3319                 if ($entry->{nomatch}) {
3320                     if ($feature_ipset_nomatch) {
3321                         push @{$ipset_ruleset->{$name}}, "$cmd nomatch";
3322                     } else {
3323                         warn "ignore !$cidr - nomatch not supported by kernel\n";
3324                     }
3325                 } else {
3326                     push @{$ipset_ruleset->{$name}}, $cmd;
3327                 }
3328             }
3329         }
3330     }
3331 }
3332
3333 sub round_powerof2 {
3334     my ($int) = @_;
3335
3336     $int--;
3337     $int |= $int >> $_ foreach (1,2,4,8,16);
3338     return ++$int;
3339 }
3340
3341 my $set_global_log_ratelimit = sub {
3342     my $cluster_opts = shift;
3343
3344     $global_log_ratelimit = '--limit 1/sec';
3345     if (defined(my $log_rlimit = $cluster_opts->{log_ratelimit})) {
3346         my $ll_format = $cluster_option_properties->{log_ratelimit}->{format};
3347         my $limit = PVE::JSONSchema::parse_property_string($ll_format, $log_rlimit);
3348
3349         if ($limit->{enable}) {
3350             if (my $rate = $limit->{rate}) {
3351                 $global_log_ratelimit = "--limit $rate";
3352             }
3353             if (my $burst = $limit->{burst}) {
3354                 $global_log_ratelimit .= " --limit-burst $burst";
3355             }
3356         } else {
3357             $global_log_ratelimit = undef;
3358         }
3359     }
3360 };
3361
3362 sub load_clusterfw_conf {
3363     my ($filename) = @_;
3364
3365     $filename = $clusterfw_conf_filename if !defined($filename);
3366     my $empty_conf = {
3367         rules => [],
3368         options => {},
3369         aliases => {},
3370         groups => {},
3371         group_comments => {},
3372         ipset => {} ,
3373         ipset_comments => {},
3374     };
3375
3376     my $cluster_conf = generic_fw_config_parser($filename, $empty_conf, $empty_conf, 'cluster');
3377     $set_global_log_ratelimit->($cluster_conf->{options});
3378
3379     return $cluster_conf;
3380 }
3381
3382 sub save_clusterfw_conf {
3383     my ($cluster_conf) = @_;
3384
3385     my $raw = '';
3386
3387     my $options = $cluster_conf->{options};
3388     $raw .= &$format_options($options) if $options && scalar(keys %$options);
3389
3390     my $aliases = $cluster_conf->{aliases};
3391     $raw .= &$format_aliases($aliases) if $aliases && scalar(keys %$aliases);
3392
3393     $raw .= &$format_ipsets($cluster_conf) if $cluster_conf->{ipset};
3394  
3395     my $rules = $cluster_conf->{rules};
3396     if ($rules && scalar(@$rules)) {
3397         $raw .= "[RULES]\n\n";
3398         $raw .= &$format_rules($rules, 1);
3399         $raw .= "\n";
3400     }
3401
3402     if ($cluster_conf->{groups}) {
3403         foreach my $group (sort keys %{$cluster_conf->{groups}}) {
3404             my $rules = $cluster_conf->{groups}->{$group};
3405             if (my $comment = $cluster_conf->{group_comments}->{$group}) {
3406                 my $utf8comment = encode('utf8', $comment);
3407                 $raw .= "[group $group] # $utf8comment\n\n";
3408             } else {
3409                 $raw .= "[group $group]\n\n";
3410             }
3411
3412             $raw .= &$format_rules($rules, 0);
3413             $raw .= "\n";
3414         }
3415     }
3416
3417     if ($raw) {
3418         mkdir $pvefw_conf_dir;
3419         PVE::Tools::file_set_contents($clusterfw_conf_filename, $raw);
3420     } else {
3421         unlink $clusterfw_conf_filename;
3422     }
3423 }
3424
3425 sub load_hostfw_conf {
3426     my ($cluster_conf, $filename) = @_;
3427
3428     $filename = $hostfw_conf_filename if !defined($filename);
3429
3430     my $empty_conf = { rules => [], options => {}};
3431     return generic_fw_config_parser($filename, $cluster_conf, $empty_conf, 'host');
3432 }
3433
3434 sub save_hostfw_conf {
3435     my ($hostfw_conf) = @_;
3436
3437     my $raw = '';
3438
3439     my $options = $hostfw_conf->{options};
3440     $raw .= &$format_options($options) if $options && scalar(keys %$options);
3441
3442     my $rules = $hostfw_conf->{rules};
3443     if ($rules && scalar(@$rules)) {
3444         $raw .= "[RULES]\n\n";
3445         $raw .= &$format_rules($rules, 1);
3446         $raw .= "\n";
3447     }
3448
3449     if ($raw) {
3450         PVE::Tools::file_set_contents($hostfw_conf_filename, $raw);
3451     } else {
3452         unlink $hostfw_conf_filename;
3453     }
3454 }
3455
3456 sub compile {
3457     my ($cluster_conf, $hostfw_conf, $vmdata) = @_;
3458
3459     my $vmfw_configs;
3460
3461     # fixme: once we read standard chains from config this needs to be put in test/standard cases below
3462     $pve_std_chains = dclone($pve_std_chains_conf);
3463
3464     if ($vmdata) { # test mode
3465         my $testdir = $vmdata->{testdir} || die "no test directory specified";
3466         my $filename = "$testdir/cluster.fw";
3467         $cluster_conf = load_clusterfw_conf($filename);
3468
3469         $filename = "$testdir/host.fw";
3470         $hostfw_conf = load_hostfw_conf($cluster_conf, $filename);
3471
3472         $vmfw_configs = read_vm_firewall_configs($cluster_conf, $vmdata, $testdir);
3473     } else { # normal operation
3474         $cluster_conf = load_clusterfw_conf(undef) if !$cluster_conf;
3475
3476         $hostfw_conf = load_hostfw_conf($cluster_conf, undef) if !$hostfw_conf;
3477
3478         $vmdata = read_local_vm_config();
3479         $vmfw_configs = read_vm_firewall_configs($cluster_conf, $vmdata, undef);
3480     }
3481
3482     return ({},{},{},{}) if !$cluster_conf->{options}->{enable};
3483
3484     my $localnet;
3485     if ($cluster_conf->{aliases}->{local_network}) {
3486         $localnet = $cluster_conf->{aliases}->{local_network}->{cidr};
3487     } else {
3488         my $localnet_ver;
3489         ($localnet, $localnet_ver) = parse_ip_or_cidr(local_network() || '127.0.0.0/8');
3490
3491         $cluster_conf->{aliases}->{local_network} = {
3492             name => 'local_network', cidr => $localnet, ipversion => $localnet_ver };
3493     }
3494
3495     push @{$cluster_conf->{ipset}->{management}}, { cidr => $localnet };
3496
3497     my $ruleset = compile_iptables_filter($cluster_conf, $hostfw_conf, $vmfw_configs, $vmdata, 4);
3498     my $rulesetv6 = compile_iptables_filter($cluster_conf, $hostfw_conf, $vmfw_configs, $vmdata, 6);
3499     my $ebtables_ruleset = compile_ebtables_filter($cluster_conf, $hostfw_conf, $vmfw_configs, $vmdata);
3500     my $ipset_ruleset = compile_ipsets($cluster_conf, $vmfw_configs, $vmdata);
3501
3502     return ($ruleset, $ipset_ruleset, $rulesetv6, $ebtables_ruleset);
3503 }
3504
3505 sub compile_iptables_filter {
3506     my ($cluster_conf, $hostfw_conf, $vmfw_configs, $vmdata, $ipversion) = @_;
3507
3508     my $ruleset = {};
3509
3510     ruleset_create_chain($ruleset, "PVEFW-INPUT");
3511     ruleset_create_chain($ruleset, "PVEFW-OUTPUT");
3512
3513     ruleset_create_chain($ruleset, "PVEFW-FORWARD");
3514
3515     my $hostfw_options = $hostfw_conf->{options} || {};
3516
3517     # fixme: what log level should we use here?
3518     my $loglevel = get_option_log_level($hostfw_options, "log_level_out");
3519
3520     my $conn_allow_invalid = $hostfw_options->{nf_conntrack_allow_invalid} // 0;
3521     ruleset_chain_add_conn_filters($ruleset, "PVEFW-FORWARD", $conn_allow_invalid, "ACCEPT");
3522
3523     ruleset_create_chain($ruleset, "PVEFW-FWBR-IN");
3524     ruleset_chain_add_input_filters($ruleset, "PVEFW-FWBR-IN", $ipversion, $hostfw_options, $cluster_conf, $loglevel);
3525
3526     ruleset_addrule($ruleset, "PVEFW-FORWARD", "-m physdev --physdev-is-bridged --physdev-in fwln+", "-j PVEFW-FWBR-IN");
3527
3528     ruleset_create_chain($ruleset, "PVEFW-FWBR-OUT");
3529     ruleset_addrule($ruleset, "PVEFW-FORWARD", "-m physdev --physdev-is-bridged --physdev-out fwln+", "-j PVEFW-FWBR-OUT");
3530
3531     generate_std_chains($ruleset, $hostfw_options, $ipversion);
3532
3533     my $hostfw_enable = !(defined($hostfw_options->{enable}) && ($hostfw_options->{enable} == 0));
3534
3535     if ($hostfw_enable) {
3536         eval { enable_host_firewall($ruleset, $hostfw_conf, $cluster_conf, $ipversion); };
3537         warn $@ if $@; # just to be sure - should not happen
3538     }
3539
3540     # generate firewall rules for QEMU VMs
3541     foreach my $vmid (sort keys %{$vmdata->{qemu}}) {
3542         eval {
3543             my $conf = $vmdata->{qemu}->{$vmid};
3544             my $vmfw_conf = $vmfw_configs->{$vmid};
3545             return if !$vmfw_conf;
3546
3547             foreach my $netid (sort keys %$conf) {
3548                 next if $netid !~ m/^net(\d+)$/;
3549                 my $net = PVE::QemuServer::parse_net($conf->{$netid});
3550                 next if !$net->{firewall};
3551                 my $iface = "tap${vmid}i$1";
3552
3553                 my $macaddr = $net->{macaddr};
3554                 generate_tap_rules_direction($ruleset, $cluster_conf, $iface, $netid, $macaddr,
3555                                              $vmfw_conf, $vmid, 'IN', $ipversion);
3556                 generate_tap_rules_direction($ruleset, $cluster_conf, $iface, $netid, $macaddr,
3557                                              $vmfw_conf, $vmid, 'OUT', $ipversion);
3558             }
3559         };
3560         warn $@ if $@; # just to be sure - should not happen
3561     }
3562
3563     # generate firewall rules for LXC containers
3564     foreach my $vmid (sort keys %{$vmdata->{lxc}}) {
3565         eval {