]> git.proxmox.com Git - qemu-server.git/blobdiff - PVE/QemuServer.pm
fix PVE::HA use clause so HA resources get registered
[qemu-server.git] / PVE / QemuServer.pm
index 19fcf4979084689d132d8746e3249a76bd01daf1..d10e1e50021be57f21342fa2c86f426eb1dd3c42 100644 (file)
@@ -30,6 +30,7 @@ use PVE::ProcFSTools;
 use PVE::QMPClient;
 use PVE::RPCEnvironment;
 use Time::HiRes qw(gettimeofday);
+use File::Copy qw(copy);
 
 my $qemu_snap_storage = {rbd => 1, sheepdog => 1};
 
@@ -67,76 +68,12 @@ PVE::JSONSchema::register_standard_option('pve-snapshot-name', {
 
 #no warnings 'redefine';
 
-unless(defined(&_VZSYSCALLS_H_)) {
-    eval 'sub _VZSYSCALLS_H_ () {1;}' unless defined(&_VZSYSCALLS_H_);
-    require 'sys/syscall.ph';
-    if(defined(&__x86_64__)) {
-       eval 'sub __NR_fairsched_vcpus () {499;}' unless defined(&__NR_fairsched_vcpus);
-       eval 'sub __NR_fairsched_mknod () {504;}' unless defined(&__NR_fairsched_mknod);
-       eval 'sub __NR_fairsched_rmnod () {505;}' unless defined(&__NR_fairsched_rmnod);
-       eval 'sub __NR_fairsched_chwt () {506;}' unless defined(&__NR_fairsched_chwt);
-       eval 'sub __NR_fairsched_mvpr () {507;}' unless defined(&__NR_fairsched_mvpr);
-       eval 'sub __NR_fairsched_rate () {508;}' unless defined(&__NR_fairsched_rate);
-       eval 'sub __NR_setluid () {501;}' unless defined(&__NR_setluid);
-       eval 'sub __NR_setublimit () {502;}' unless defined(&__NR_setublimit);
-    }
-    elsif(defined( &__i386__) ) {
-       eval 'sub __NR_fairsched_mknod () {500;}' unless defined(&__NR_fairsched_mknod);
-       eval 'sub __NR_fairsched_rmnod () {501;}' unless defined(&__NR_fairsched_rmnod);
-       eval 'sub __NR_fairsched_chwt () {502;}' unless defined(&__NR_fairsched_chwt);
-       eval 'sub __NR_fairsched_mvpr () {503;}' unless defined(&__NR_fairsched_mvpr);
-       eval 'sub __NR_fairsched_rate () {504;}' unless defined(&__NR_fairsched_rate);
-       eval 'sub __NR_fairsched_vcpus () {505;}' unless defined(&__NR_fairsched_vcpus);
-       eval 'sub __NR_setluid () {511;}' unless defined(&__NR_setluid);
-       eval 'sub __NR_setublimit () {512;}' unless defined(&__NR_setublimit);
-    } else {
-       die("no fairsched syscall for this arch");
-    }
-    require 'asm/ioctl.ph';
-    eval 'sub KVM_GET_API_VERSION () { &_IO(0xAE, 0x);}' unless defined(&KVM_GET_API_VERSION);
-}
-
-sub fairsched_mknod {
-    my ($parent, $weight, $desired) = @_;
-
-    return syscall(&__NR_fairsched_mknod, int($parent), int($weight), int($desired));
-}
-
-sub fairsched_rmnod {
-    my ($id) = @_;
-
-    return syscall(&__NR_fairsched_rmnod, int($id));
-}
+sub cgroups_write {
+   my ($controller, $vmid, $option, $value) = @_;
 
-sub fairsched_mvpr {
-    my ($pid, $newid) = @_;
+   my $path = "/sys/fs/cgroup/$controller/qemu.slice/$vmid.scope/$option";
+   PVE::ProcFSTools::write_proc_entry($path, $value);
 
-    return syscall(&__NR_fairsched_mvpr, int($pid), int($newid));
-}
-
-sub fairsched_vcpus {
-    my ($id, $vcpus) = @_;
-
-    return syscall(&__NR_fairsched_vcpus, int($id), int($vcpus));
-}
-
-sub fairsched_rate {
-    my ($id, $op, $rate) = @_;
-
-    return syscall(&__NR_fairsched_rate, int($id), int($op), int($rate));
-}
-
-use constant FAIRSCHED_SET_RATE  => 0;
-use constant FAIRSCHED_DROP_RATE => 1;
-use constant FAIRSCHED_GET_RATE  => 2;
-
-sub fairsched_cpulimit {
-    my ($id, $limit) = @_;
-
-    my $cpulim1024 = int($limit * 1024 / 100);
-    my $op = $cpulim1024 ? FAIRSCHED_SET_RATE : FAIRSCHED_DROP_RATE;
-
-    return fairsched_rate($id, $op, $cpulim1024);
 }
 
 my $nodename = PVE::INotify::nodename();
@@ -153,6 +90,22 @@ mkdir $lock_dir;
 
 my $pcisysfs = "/sys/bus/pci";
 
+my $cpudesc = {
+    cputype => {
+       description => "Emulated CPU type.",
+       type => 'string',
+       enum => [ qw(486 athlon pentium pentium2 pentium3 coreduo core2duo kvm32 kvm64 qemu32 qemu64 phenom Conroe Penryn Nehalem Westmere SandyBridge IvyBridge Haswell Haswell-noTSX Broadwell Broadwell-noTSX Opteron_G1 Opteron_G2 Opteron_G3 Opteron_G4 Opteron_G5 host) ],
+       default => 'kvm64',
+       default_key => 1,
+    },
+    hidden => {
+       description => "Do not identify as a KVM virtual machine.",
+       type => 'boolean',
+       optional => 1,
+       default => 0
+    },
+};
+
 my $confdesc = {
     onboot => {
        optional => 1,
@@ -186,9 +139,10 @@ my $confdesc = {
     },
     cpulimit => {
        optional => 1,
-       type => 'integer',
-       description => "Limit of CPU usage in per cent. Note if the computer has 2 CPUs, it has total of 200% CPU time. Value '0' indicates no CPU limit.\n\nNOTE: This option is currently ignored.",
+       type => 'number',
+       description => "Limit of CPU usage. Note if the computer has 2 CPUs, it has total of '2' CPU time. Value '0' indicates no CPU limit.",
        minimum => 0,
+       maximum => 128,
        default => 0,
     },
     cpuunits => {
@@ -415,8 +369,7 @@ EODESCR
        optional => 1,
        description => "Emulated CPU type.",
        type => 'string',
-       enum => [ qw(486 athlon pentium pentium2 pentium3 coreduo core2duo kvm32 kvm64 qemu32 qemu64 phenom Conroe Penryn Nehalem Westmere SandyBridge IvyBridge Haswell Broadwell Opteron_G1 Opteron_G2 Opteron_G3 Opteron_G4 Opteron_G5 host) ],
-       default => 'kvm64',
+       format => $cpudesc,
     },
     parent => get_standard_option('pve-snapshot-name', {
        optional => 1,
@@ -436,17 +389,29 @@ EODESCR
     machine => {
        description => "Specific the Qemu machine type.",
        type => 'string',
-       pattern => '(pc|pc(-i440fx)?-\d+\.\d+|q35|pc-q35-\d+\.\d+)',
+       pattern => '(pc|pc(-i440fx)?-\d+\.\d+(\.pxe)?|q35|pc-q35-\d+\.\d+(\.pxe)?)',
        maxLength => 40,
        optional => 1,
     },
     smbios1 => {
        description => "Specify SMBIOS type 1 fields.",
        type => 'string', format => 'pve-qm-smbios1',
-       typetext => "[manufacturer=str][,product=str][,version=str][,serial=str] [,uuid=uuid][,sku=str][,family=str]",
        maxLength => 256,
        optional => 1,
     },
+    protection => {
+       optional => 1,
+       type => 'boolean',
+       description => "Sets the protection flag of the VM. This will prevent the remove operation.",
+       default => 0,
+    },
+    bios => {
+       optional => 1,
+       type => 'string',
+       enum => [ qw(seabios ovmf) ],
+       description => "Select BIOS implementation.",
+       default => 'seabios',
+    },
 };
 
 # what about other qemu settings ?
@@ -504,7 +469,7 @@ my $nic_model_list_txt = join(' ', sort @$nic_model_list);
 my $netdesc = {
     optional => 1,
     type => 'string', format => 'pve-qm-net',
-    typetext => "MODEL=XX:XX:XX:XX:XX:XX [,bridge=<dev>][,queues=<nbqueues>][,rate=<mbps>] [,tag=<vlanid>][,firewall=0|1],link_down=0|1]",
+    typetext => "MODEL=XX:XX:XX:XX:XX:XX [,bridge=<dev>][,queues=<nbqueues>][,rate=<mbps>] [,tag=<vlanid>][,trunks=<vlanid[;vlanid]>][,firewall=0|1],link_down=0|1]",
     description => <<EODESCR,
 Specify network devices.
 
@@ -535,38 +500,232 @@ for (my $i = 0; $i < $MAX_NETS; $i++)  {
 
 my $drivename_hash;
 
+my %drivedesc_base = (
+    volume => { alias => 'file' },
+    file => {
+       type => 'pve-volume-id',
+       default_key => 1,
+       format_description => 'volume',
+       description => "The drive's backing volume.",
+    },
+    media => {
+       type => 'string',
+       format_description => 'cdrom|disk',
+       enum => [qw(cdrom disk)],
+       description => "The drive's media type.",
+       default => 'disk',
+       optional => 1
+    },
+    cyls => {
+       type => 'integer',
+       format_description => 'count',
+       description => "Force the drive's physical geometry to have a specific cylinder count.",
+       optional => 1
+    },
+    heads => {
+       type => 'integer',
+       format_description => 'count',
+       description => "Force the drive's physical geometry to have a specific head count.",
+       optional => 1
+    },
+    secs => {
+       type => 'integer',
+       format_description => 'count',
+       description => "Force the drive's physical geometry to have a specific sector count.",
+       optional => 1
+    },
+    trans => {
+       type => 'string',
+       format_description => 'none|lba|auto',
+       enum => [qw(none lba auto)],
+       description => "Force disk geometry bios translation mode.",
+       optional => 1,
+    },
+    snapshot => {
+       type => 'boolean',
+       format_description => 'on|off',
+       description => "Whether the drive should be included when making snapshots.",
+       optional => 1,
+    },
+    cache => {
+       type => 'string',
+       format_description => 'none|writethrough|writeback|unsafe|directsync',
+       enum => [qw(none writethrough writeback unsafe directsync)],
+       description => "The drive's cache mode",
+       optional => 1,
+    },
+    format => {
+       type => 'string',
+       format_description => 'drive format',
+       enum => [qw(raw cow qcow qed qcow2 vmdk cloop)],
+       description => "The drive's backing file's data format.",
+       optional => 1,
+    },
+    size => {
+       type => 'disk-size',
+       description => "Disk size. This is purely informational and has no effect.",
+       optional => 1,
+    },
+    backup => {
+       type => 'boolean',
+       format_description => 'on|off',
+       description => "Whether the drive should be included when making backups.",
+       optional => 1,
+    },
+    werror => {
+       type => 'string',
+       format_description => 'enospc|ignore|report|stop',
+       enum => [qw(enospc ignore report stop)],
+       description => 'Write error action.',
+       optional => 1,
+    },
+    aio => {
+       type => 'string',
+       format_description => 'native|threads',
+       enum => [qw(native threads)],
+       description => 'AIO type to use.',
+       optional => 1,
+    },
+    discard => {
+       type => 'string',
+       format_description => 'ignore|on',
+       enum => [qw(ignore on)],
+       description => 'Controls whether to pass discard/trim requests to the underlying storage.',
+       optional => 1,
+    },
+    detect_zeroes => {
+       type => 'boolean',
+       description => 'Controls whether to detect and try to optimize writes of zeroes.',
+       optional => 1,
+    },
+    serial => {
+       type => 'string',
+       format_description => 'serial',
+       description => "The drive's reported serial number.",
+       optional => 1,
+    }
+);
+
+my %rerror_fmt = (
+    rerror => {
+       type => 'string',
+       format_description => 'ignore|report|stop',
+       enum => [qw(ignore report stop)],
+       description => 'Read error action.',
+       optional => 1,
+    },
+);
+
+my %iothread_fmt = ( iothread => {
+       type => 'boolean',
+       format_description => 'off|on',
+       description => "Whether to use iothreads for this drive",
+       optional => 1,
+});
+
+my %model_fmt = (
+    model => {
+       type => 'string',
+       format_description => 'model',
+       description => "The drive's reported model name.",
+       optional => 1,
+    },
+);
+
+my %queues_fmt = (
+    queues => {
+       type => 'integer',
+       format_description => 'nbqueues',
+       description => "Number of queues.",
+       minimum => 2,
+       optional => 1
+    }
+);
+
+my $add_throttle_desc = sub {
+    my ($key, $type, $what, $size, $longsize) = @_;
+    $drivedesc_base{$key} = {
+       type => $type,
+       format_description => $size,
+       description => "Maximum $what speed in $longsize per second.",
+       optional => 1,
+    };
+};
+# throughput: (leaky bucket)
+$add_throttle_desc->('bps',     'integer', 'r/w speed',   'bps',  'bytes');
+$add_throttle_desc->('bps_rd',  'integer', 'read speed',  'bps',  'bytes');
+$add_throttle_desc->('bps_wr',  'integer', 'write speed', 'bps',  'bytes');
+$add_throttle_desc->('mbps',    'float',   'r/w speed',   'mbps', 'megabytes');
+$add_throttle_desc->('mbps_rd', 'float',   'read speed',  'mbps', 'megabytes');
+$add_throttle_desc->('mbps_wr', 'float',   'write speed', 'mbps', 'megabytes');
+$add_throttle_desc->('iops',    'integer', 'r/w I/O',     'iops', 'operations');
+$add_throttle_desc->('iops_rd', 'integer', 'read I/O',    'iops', 'operations');
+$add_throttle_desc->('iops_wr', 'integer', 'write I/O',   'iops', 'operations');
+
+# pools: (pool of IO before throttling starts taking effect)
+$add_throttle_desc->('mbps_max',    'float',   'unthrottled r/w pool',       'mbps', 'megabytes');
+$add_throttle_desc->('mbps_rd_max', 'float',   'unthrottled read pool',      'mbps', 'megabytes');
+$add_throttle_desc->('mbps_wr_max', 'float',   'unthrottled write pool',     'mbps', 'megabytes');
+$add_throttle_desc->('iops_max',    'integer', 'unthrottled r/w I/O pool',   'iops', 'operations');
+$add_throttle_desc->('iops_rd_max', 'integer', 'unthrottled read I/O pool',  'iops', 'operations');
+$add_throttle_desc->('iops_wr_max', 'integer', 'unthrottled write I/O pool', 'iops', 'operations');
+
+my $ide_fmt = {
+    %drivedesc_base,
+    %rerror_fmt,
+    %model_fmt,
+};
+
 my $idedesc = {
     optional => 1,
-    type => 'string', format => 'pve-qm-drive',
-    typetext => '[volume=]volume,] [,media=cdrom|disk] [,cyls=c,heads=h,secs=s[,trans=t]] [,snapshot=on|off] [,cache=none|writethrough|writeback|unsafe|directsync] [,format=f] [,backup=yes|no] [,rerror=ignore|report|stop] [,werror=enospc|ignore|report|stop] [,aio=native|threads] [,discard=ignore|on]',
+    type => 'string', format => $ide_fmt,
     description => "Use volume as IDE hard disk or CD-ROM (n is 0 to " .($MAX_IDE_DISKS -1) . ").",
 };
 PVE::JSONSchema::register_standard_option("pve-qm-ide", $idedesc);
 
+my $scsi_fmt = {
+    %drivedesc_base,
+    %iothread_fmt,
+    %queues_fmt,
+};
 my $scsidesc = {
     optional => 1,
-    type => 'string', format => 'pve-qm-drive',
-    typetext => '[volume=]volume,] [,media=cdrom|disk] [,cyls=c,heads=h,secs=s[,trans=t]] [,snapshot=on|off] [,cache=none|writethrough|writeback|unsafe|directsync] [,format=f] [,backup=yes|no] [,rerror=ignore|report|stop] [,werror=enospc|ignore|report|stop] [,aio=native|threads] [,discard=ignore|on] [,iothread=on] [,queues=<nbqueues>]',
+    type => 'string', format => $scsi_fmt,
     description => "Use volume as SCSI hard disk or CD-ROM (n is 0 to " . ($MAX_SCSI_DISKS - 1) . ").",
 };
 PVE::JSONSchema::register_standard_option("pve-qm-scsi", $scsidesc);
 
+my $sata_fmt = {
+    %drivedesc_base,
+    %rerror_fmt,
+};
 my $satadesc = {
     optional => 1,
-    type => 'string', format => 'pve-qm-drive',
-    typetext => '[volume=]volume,] [,media=cdrom|disk] [,cyls=c,heads=h,secs=s[,trans=t]] [,snapshot=on|off] [,cache=none|writethrough|writeback|unsafe|directsync] [,format=f] [,backup=yes|no] [,rerror=ignore|report|stop] [,werror=enospc|ignore|report|stop] [,aio=native|threads]  [,discard=ignore|on]',
+    type => 'string', format => $sata_fmt,
     description => "Use volume as SATA hard disk or CD-ROM (n is 0 to " . ($MAX_SATA_DISKS - 1). ").",
 };
 PVE::JSONSchema::register_standard_option("pve-qm-sata", $satadesc);
 
+my $virtio_fmt = {
+    %drivedesc_base,
+    %iothread_fmt,
+    %rerror_fmt,
+};
 my $virtiodesc = {
     optional => 1,
-    type => 'string', format => 'pve-qm-drive',
-    typetext => '[volume=]volume,] [,media=cdrom|disk] [,cyls=c,heads=h,secs=s[,trans=t]] [,snapshot=on|off] [,cache=none|writethrough|writeback|unsafe|directsync] [,format=f] [,backup=yes|no] [,rerror=ignore|report|stop] [,werror=enospc|ignore|report|stop] [,aio=native|threads]  [,discard=ignore|on] [,iothread=on]',
+    type => 'string', format => $virtio_fmt,
     description => "Use volume as VIRTIO hard disk (n is 0 to " . ($MAX_VIRTIO_DISKS - 1) . ").",
 };
 PVE::JSONSchema::register_standard_option("pve-qm-virtio", $virtiodesc);
 
+my $alldrive_fmt = {
+    %drivedesc_base,
+    %rerror_fmt,
+    %iothread_fmt,
+    %model_fmt,
+    %queues_fmt,
+};
+
 my $usbdesc = {
     optional => 1,
     type => 'string', format => 'pve-qm-usb-device',
@@ -591,7 +750,7 @@ PVE::JSONSchema::register_standard_option("pve-qm-usb", $usbdesc);
 my $hostpcidesc = {
         optional => 1,
         type => 'string', format => 'pve-qm-hostpci',
-        typetext => "[host=]HOSTPCIDEVICE [,driver=kvm|vfio] [,rombar=on|off] [,pcie=0|1] [,x-vga=on|off]",
+        typetext => "[host=]HOSTPCIDEVICE [,rombar=on|off] [,pcie=0|1] [,x-vga=on|off]",
         description => <<EODESCR,
 Map host pci devices. HOSTPCIDEVICE syntax is:
 
@@ -615,7 +774,7 @@ my $serialdesc = {
        description =>  <<EODESCR,
 Create a serial device inside the VM (n is 0 to 3), and pass through a host serial device (i.e. /dev/ttyS0), or create a unix socket on the host side (use 'qm terminal' to open a terminal connection).
 
-Note: This option allows direct access to host hardware. So it is no longer possible to migrate such machines - use with special care.
+Note: If you pass through a host serial device, it is no longer possible to migrate such machines - use with special care.
 
 Experimental: user reported problems with this option.
 EODESCR
@@ -708,7 +867,7 @@ sub kvm_user_version {
 
     my $tmp = `kvm -help 2>/dev/null`;
 
-    if ($tmp =~ m/^QEMU( PC)? emulator version (\d+\.\d+(\.\d+)?)[,\s]/) {
+    if ($tmp =~ m/^QEMU( PC)? emulator version (\d+\.\d+(\.\d+)?)(\.\d+)?[,\s]/) {
        $kvm_user_version = $2;
     }
 
@@ -894,164 +1053,71 @@ sub pve_verify_hotplug_features {
     die "unable to parse hotplug option\n";
 }
 
-my $parse_size = sub {
-    my ($value) = @_;
-
-    return undef if $value !~ m/^(\d+(\.\d+)?)([KMG])?$/;
-    my ($size, $unit) = ($1, $3);
-    if ($unit) {
-       if ($unit eq 'K') {
-           $size = $size * 1024;
-       } elsif ($unit eq 'M') {
-           $size = $size * 1024 * 1024;
-       } elsif ($unit eq 'G') {
-           $size = $size * 1024 * 1024 * 1024;
-       }
-    }
-    return int($size);
-};
-
-my $format_size = sub {
-    my ($size) = @_;
-
-    $size = int($size);
-
-    my $kb = int($size/1024);
-    return $size if $kb*1024 != $size;
-
-    my $mb = int($kb/1024);
-    return "${kb}K" if $mb*1024 != $kb;
-
-    my $gb = int($mb/1024);
-    return "${mb}M" if $gb*1024 != $mb;
-
-    return "${gb}G";
-};
-
 # ideX = [volume=]volume-id[,media=d][,cyls=c,heads=h,secs=s[,trans=t]]
 #        [,snapshot=on|off][,cache=on|off][,format=f][,backup=yes|no]
 #        [,rerror=ignore|report|stop][,werror=enospc|ignore|report|stop]
-#        [,aio=native|threads][,discard=ignore|on][,iothread=on]
+#        [,aio=native|threads][,discard=ignore|on][,detect_zeroes=on|off]
+#        [,iothread=on][,serial=serial][,model=model]
 
 sub parse_drive {
     my ($key, $data) = @_;
 
-    my $res = {};
+    my ($interface, $index);
 
-    # $key may be undefined - used to verify JSON parameters
-    if (!defined($key)) {
-       $res->{interface} = 'unknown'; # should not harm when used to verify parameters
-       $res->{index} = 0;
-    } elsif ($key =~ m/^([^\d]+)(\d+)$/) {
-       $res->{interface} = $1;
-       $res->{index} = $2;
+    if ($key =~ m/^([^\d]+)(\d+)$/) {
+       $interface = $1;
+       $index = $2;
     } else {
        return undef;
     }
 
-    foreach my $p (split (/,/, $data)) {
-       next if $p =~ m/^\s*$/;
-
-       if ($p =~ m/^(file|volume|cyls|heads|secs|trans|media|snapshot|cache|format|rerror|werror|backup|aio|bps|mbps|mbps_max|bps_rd|mbps_rd|mbps_rd_max|bps_wr|mbps_wr|mbps_wr_max|iops|iops_max|iops_rd|iops_rd_max|iops_wr|iops_wr_max|size|discard|iothread|queues)=(.+)$/) {
-           my ($k, $v) = ($1, $2);
-
-           $k = 'file' if $k eq 'volume';
-
-           return undef if defined $res->{$k};
-
-           if ($k eq 'bps' || $k eq 'bps_rd' || $k eq 'bps_wr') {
-               return undef if !$v || $v !~ m/^\d+/;
-               $k = "m$k";
-               $v = sprintf("%.3f", $v / (1024*1024));
-           }
-           $res->{$k} = $v;
-       } else {
-           if (!$res->{file} && $p !~ m/=/) {
-               $res->{file} = $p;
-           } else {
-               return undef;
+    my $desc = $key =~ /^unused\d+$/ ? $alldrive_fmt
+                                     : $confdesc->{$key}->{format};
+    if (!$desc) {
+       warn "invalid drive key: $key\n";
+       return undef;
+    }
+    my $res = eval { PVE::JSONSchema::parse_property_string($desc, $data) };
+    return undef if !$res;
+    $res->{interface} = $interface;
+    $res->{index} = $index;
+
+    my $error = 0;
+    foreach my $opt (qw(bps bps_rd bps_wr)) {
+       if (my $bps = defined(delete $res->{$opt})) {
+           if (defined($res->{"m$opt"})) {
+               warn "both $opt and m$opt specified\n";
+               ++$error;
+               next;
            }
+           $res->{"m$opt"} = sprintf("%.3f", $bps / (1024*1024.0));
        }
     }
-
-    return undef if !$res->{file};
-
-    if($res->{file} =~ m/\.(raw|cow|qcow|qcow2|vmdk|cloop)$/){
-       $res->{format} = $1;
-    }
-
-    return undef if $res->{cache} &&
-       $res->{cache} !~ m/^(off|none|writethrough|writeback|unsafe|directsync)$/;
-    return undef if $res->{snapshot} && $res->{snapshot} !~ m/^(on|off)$/;
-    return undef if $res->{cyls} && $res->{cyls} !~ m/^\d+$/;
-    return undef if $res->{heads} && $res->{heads} !~ m/^\d+$/;
-    return undef if $res->{secs} && $res->{secs} !~ m/^\d+$/;
-    return undef if $res->{media} && $res->{media} !~ m/^(disk|cdrom)$/;
-    return undef if $res->{trans} && $res->{trans} !~ m/^(none|lba|auto)$/;
-    return undef if $res->{format} && $res->{format} !~ m/^(raw|cow|qcow|qcow2|vmdk|cloop)$/;
-    return undef if $res->{rerror} && $res->{rerror} !~ m/^(ignore|report|stop)$/;
-    return undef if $res->{werror} && $res->{werror} !~ m/^(enospc|ignore|report|stop)$/;
-    return undef if $res->{backup} && $res->{backup} !~ m/^(yes|no)$/;
-    return undef if $res->{aio} && $res->{aio} !~ m/^(native|threads)$/;
-    return undef if $res->{discard} && $res->{discard} !~ m/^(ignore|on)$/;
-    return undef if $res->{iothread} && $res->{iothread} !~ m/^(on)$/;
-    return undef if $res->{queues} && ($res->{queues} !~ m/^\d+$/ || $res->{queues} < 2);
+    return undef if $error;
 
     return undef if $res->{mbps_rd} && $res->{mbps};
     return undef if $res->{mbps_wr} && $res->{mbps};
-
-    return undef if $res->{mbps} && $res->{mbps} !~ m/^\d+(\.\d+)?$/;
-    return undef if $res->{mbps_max} && $res->{mbps_max} !~ m/^\d+(\.\d+)?$/;
-    return undef if $res->{mbps_rd} && $res->{mbps_rd} !~ m/^\d+(\.\d+)?$/;
-    return undef if $res->{mbps_rd_max} && $res->{mbps_rd_max} !~ m/^\d+(\.\d+)?$/;
-    return undef if $res->{mbps_wr} && $res->{mbps_wr} !~ m/^\d+(\.\d+)?$/;
-    return undef if $res->{mbps_wr_max} && $res->{mbps_wr_max} !~ m/^\d+(\.\d+)?$/;
-
     return undef if $res->{iops_rd} && $res->{iops};
     return undef if $res->{iops_wr} && $res->{iops};
 
-
-    return undef if $res->{iops} && $res->{iops} !~ m/^\d+$/;
-    return undef if $res->{iops_max} && $res->{iops_max} !~ m/^\d+$/;
-    return undef if $res->{iops_rd} && $res->{iops_rd} !~ m/^\d+$/;
-    return undef if $res->{iops_rd_max} && $res->{iops_rd_max} !~ m/^\d+$/;
-    return undef if $res->{iops_wr} && $res->{iops_wr} !~ m/^\d+$/;
-    return undef if $res->{iops_wr_max} && $res->{iops_wr_max} !~ m/^\d+$/;
-
-
-    if ($res->{size}) {
-       return undef if !defined($res->{size} = &$parse_size($res->{size}));
-    }
-
     if ($res->{media} && ($res->{media} eq 'cdrom')) {
        return undef if $res->{snapshot} || $res->{trans} || $res->{format};
        return undef if $res->{heads} || $res->{secs} || $res->{cyls};
        return undef if $res->{interface} eq 'virtio';
     }
 
-    # rerror does not work with scsi drives
-    if ($res->{rerror}) {
-       return undef if $res->{interface} eq 'scsi';
+    if (my $size = $res->{size}) {
+       return undef if !defined($res->{size} = PVE::JSONSchema::parse_size($size));
     }
 
     return $res;
 }
 
-my @qemu_drive_options = qw(heads secs cyls trans media format cache snapshot rerror werror aio discard iops iops_rd iops_wr iops_max iops_rd_max iops_wr_max);
-
 sub print_drive {
     my ($vmid, $drive) = @_;
-
-    my $opts = '';
-    foreach my $o (@qemu_drive_options, 'mbps', 'mbps_rd', 'mbps_wr', 'mbps_max', 'mbps_rd_max', 'mbps_wr_max', 'backup', 'iothread', 'queues') {
-       $opts .= ",$o=$drive->{$o}" if $drive->{$o};
-    }
-
-    if ($drive->{size}) {
-       $opts .= ",size=" . &$format_size($drive->{size});
-    }
-
-    return "$drive->{file}$opts";
+    my $data = { %$drive };
+    delete $data->{$_} for qw(index interface);
+    return PVE::JSONSchema::print_property_string($data, $alldrive_fmt);
 }
 
 sub scsi_inquiry {
@@ -1183,6 +1249,9 @@ sub print_drivedevice_full {
        my $devicetype = ($drive->{media} && $drive->{media} eq 'cdrom') ? "cd" : "hd";
 
        $device = "ide-$devicetype,bus=ide.$controller,unit=$unit,drive=drive-$drive->{interface}$drive->{index},id=$drive->{interface}$drive->{index}";
+       if ($devicetype eq 'hd' && (my $model = $drive->{model})) {
+           $device .= ",model=$model";
+       }
     } elsif ($drive->{interface} eq 'sata'){
        my $controller = int($drive->{index} / $MAX_SATA_DISKS);
        my $unit = $drive->{index} % $MAX_SATA_DISKS;
@@ -1213,54 +1282,79 @@ sub get_initiator_name {
     return $initiator;
 }
 
+my @qemu_drive_options = qw(heads secs cyls trans media format cache snapshot rerror werror aio discard iops iops_rd iops_wr iops_max iops_rd_max iops_wr_max serial);
 sub print_drive_full {
     my ($storecfg, $vmid, $drive) = @_;
 
+    my $path;
+    my $volid = $drive->{file};
+    my $format;
+    
+    if (drive_is_cdrom($drive)) {
+       $path = get_iso_path($storecfg, $vmid, $volid);
+    } else {
+       my ($storeid, $volname) = PVE::Storage::parse_volume_id($volid, 1);
+       if ($storeid) {
+           $path = PVE::Storage::path($storecfg, $volid);
+           my $scfg = PVE::Storage::storage_config($storecfg, $storeid);
+           $format = qemu_img_format($scfg, $volname);
+       } else {
+           $path = $volid;
+           $format = "raw";
+       }
+   }
+
     my $opts = '';
     foreach my $o (@qemu_drive_options) {
        next if $o eq 'bootindex';
        $opts .= ",$o=$drive->{$o}" if $drive->{$o};
     }
 
+    $opts .= ",format=$format" if $format && !$drive->{format};
+
     foreach my $o (qw(bps bps_rd bps_wr)) {
        my $v = $drive->{"m$o"};
        $opts .= ",$o=" . int($v*1024*1024) if $v;
     }
 
+    my $cache_direct = 0;
+
+    if (my $cache = $drive->{cache}) {
+       $cache_direct = $cache =~ /^(?:off|none|directsync)$/;
+    } elsif (!drive_is_cdrom($drive)) {
+       $opts .= ",cache=none";
+       $cache_direct = 1;
+    }
+
     # aio native works only with O_DIRECT
     if (!$drive->{aio}) {
-       if(!$drive->{cache} || $drive->{cache} eq 'none' || $drive->{cache} eq 'directsync') {
+       if($cache_direct) {
            $opts .= ",aio=native";
        } else {
            $opts .= ",aio=threads";
        }
     }
 
-
-    my $path;
-    my $volid = $drive->{file};
-    if (drive_is_cdrom($drive)) {
-       $path = get_iso_path($storecfg, $vmid, $volid);
-    } else {
-       if ($volid =~ m|^/|) {
-           $path = $volid;
+    if (!drive_is_cdrom($drive)) {
+       my $detectzeroes;
+       if ($drive->{detect_zeroes} && $drive->{detect_zeroes} eq 'off') {
+           $detectzeroes = 'off';
+       } elsif ($drive->{discard}) {
+           $detectzeroes = $drive->{discard} eq 'on' ? 'unmap' : 'on';
        } else {
-           $path = PVE::Storage::path($storecfg, $volid);
+           # This used to be our default with discard not being specified:
+           $detectzeroes = 'on';
        }
+       $opts .= ",detect-zeroes=$detectzeroes" if $detectzeroes;
     }
 
-    $opts .= ",cache=none" if !$drive->{cache} && !drive_is_cdrom($drive);
-
-    my $detectzeroes = $drive->{discard} ? "unmap" : "on";
-    $opts .= ",detect-zeroes=$detectzeroes" if !drive_is_cdrom($drive);
-
     my $pathinfo = $path ? "file=$path," : '';
 
     return "${pathinfo}if=none,id=drive-$drive->{interface}$drive->{index}$opts";
 }
 
 sub print_netdevice_full {
-    my ($vmid, $conf, $net, $netid, $bridges) = @_;
+    my ($vmid, $conf, $net, $netid, $bridges, $use_old_bios_files) = @_;
 
     my $bootorder = $conf->{boot} || $confdesc->{boot}->{default};
 
@@ -1277,11 +1371,28 @@ sub print_netdevice_full {
        $tmpstr .= ",vectors=$vectors,mq=on";
     }
     $tmpstr .= ",bootindex=$net->{bootindex}" if $net->{bootindex} ;
+
+    if ($use_old_bios_files) {
+       my $romfile;
+       if ($device eq 'virtio-net-pci') {
+           $romfile = 'pxe-virtio.rom';
+       } elsif ($device eq 'e1000') {
+           $romfile = 'pxe-e1000.rom';
+       } elsif ($device eq 'ne2k') {
+           $romfile = 'pxe-ne2k_pci.rom';
+       } elsif ($device eq 'pcnet') {
+           $romfile = 'pxe-pcnet.rom';
+       } elsif ($device eq 'rtl8139') {
+           $romfile = 'pxe-rtl8139.rom';
+       }
+       $tmpstr .= ",romfile=$romfile" if $romfile;
+    }
+
     return $tmpstr;
 }
 
 sub print_netdev_full {
-    my ($vmid, $conf, $net, $netid) = @_;
+    my ($vmid, $conf, $net, $netid, $hotplug) = @_;
 
     my $i = '';
     if ($netid =~ m/^net(\d+)$/) {
@@ -1302,9 +1413,10 @@ sub print_netdev_full {
     my $vmname = $conf->{name} || "vm$vmid";
 
     my $netdev = "";
+    my $script = $hotplug ? "pve-bridge-hotplug" : "pve-bridge";
 
     if ($net->{bridge}) {
-        $netdev = "type=tap,id=$netid,ifname=${ifname},script=/var/lib/qemu-server/pve-bridge,downscript=/var/lib/qemu-server/pve-bridgedown$vhostparam";
+        $netdev = "type=tap,id=$netid,ifname=${ifname},script=/var/lib/qemu-server/$script,downscript=/var/lib/qemu-server/pve-bridgedown$vhostparam";
     } else {
         $netdev = "type=user,id=$netid,hostname=$vmname";
     }
@@ -1367,8 +1479,6 @@ sub parse_hostpci {
                my $pcidevices = lspci($2);
                $res->{pciid} = $pcidevices->{$2};
            }
-       } elsif ($kv =~ m/^driver=(kvm|vfio)$/) {
-           $res->{driver} = $1;
        } elsif ($kv =~ m/^rombar=(on|off)$/) {
            $res->{rombar} = $1;
        } elsif ($kv =~ m/^x-vga=(on|off)$/) {
@@ -1406,6 +1516,8 @@ sub parse_net {
            $res->{rate} = $1;
         } elsif ($kvp =~ m/^tag=(\d+)$/) {
             $res->{tag} = $1;
+        } elsif ($kvp =~ m/^trunks=([0-9;]+)$/) {
+           $res->{trunks} = $1;
         } elsif ($kvp =~ m/^firewall=([01])$/) {
            $res->{firewall} = $1;
        } elsif ($kvp =~ m/^link_down=([01])$/) {
@@ -1429,6 +1541,7 @@ sub print_net {
     $res .= ",bridge=$net->{bridge}" if $net->{bridge};
     $res .= ",rate=$net->{rate}" if $net->{rate};
     $res .= ",tag=$net->{tag}" if $net->{tag};
+    $res .= ",trunks=$net->{trunks}" if $net->{trunks};
     $res .= ",firewall=1" if $net->{firewall};
     $res .= ",link_down=1" if $net->{link_down};
     $res .= ",queues=$net->{queues}" if $net->{queues};
@@ -1481,29 +1594,35 @@ sub vm_is_volid_owner {
     return undef;
 }
 
+sub split_flagged_list {
+    my $text = shift || '';
+    $text =~ s/[,;]/ /g;
+    $text =~ s/^\s+//;
+    return { map { /^(!?)(.*)$/ && ($2, $1) } ($text =~ /\S+/g) };
+}
+
+sub join_flagged_list {
+    my ($how, $lst) = @_;
+    join $how, map { $lst->{$_} . $_ } keys %$lst;
+}
+
 sub vmconfig_delete_pending_option {
-    my ($conf, $key) = @_;
+    my ($conf, $key, $force) = @_;
 
     delete $conf->{pending}->{$key};
-    my $pending_delete_hash = { $key => 1 };
-    foreach my $opt (PVE::Tools::split_list($conf->{pending}->{delete})) {
-       $pending_delete_hash->{$opt} = 1;
-    }
-    $conf->{pending}->{delete} = join(',', keys %$pending_delete_hash);
+    my $pending_delete_hash = split_flagged_list($conf->{pending}->{delete});
+    $pending_delete_hash->{$key} = $force ? '!' : '';
+    $conf->{pending}->{delete} = join_flagged_list(',', $pending_delete_hash);
 }
 
 sub vmconfig_undelete_pending_option {
     my ($conf, $key) = @_;
 
-    my $pending_delete_hash = {};
-    foreach my $opt (PVE::Tools::split_list($conf->{pending}->{delete})) {
-       $pending_delete_hash->{$opt} = 1;
-    }
+    my $pending_delete_hash = split_flagged_list($conf->{pending}->{delete});
     delete $pending_delete_hash->{$key};
 
-    my @keylist = keys %$pending_delete_hash;
-    if (scalar(@keylist)) {
-       $conf->{pending}->{delete} = join(',', @keylist);
+    if (%$pending_delete_hash) {
+       $conf->{pending}->{delete} = join_flagged_list(',', $pending_delete_hash);
     } else {
        delete $conf->{pending}->{delete};
     }
@@ -1532,19 +1651,18 @@ sub vmconfig_cleanup_pending {
        }
     }
 
-    # remove delete if option is not set
+    my $current_delete_hash = split_flagged_list($conf->{pending}->{delete});
     my $pending_delete_hash = {};
-    foreach my $opt (PVE::Tools::split_list($conf->{pending}->{delete})) {
+    while (my ($opt, $force) = each %$current_delete_hash) {
        if (defined($conf->{$opt})) {
-           $pending_delete_hash->{$opt} = 1;
+           $pending_delete_hash->{$opt} = $force;
        } else {
            $changes = 1;
        }
     }
 
-    my @keylist = keys %$pending_delete_hash;
-    if (scalar(@keylist)) {
-       $conf->{pending}->{delete} = join(',', @keylist);
+    if (%$pending_delete_hash) {
+       $conf->{pending}->{delete} = join_flagged_list(',', $pending_delete_hash);
     } else {
        delete $conf->{pending}->{delete};
     }
@@ -1552,57 +1670,66 @@ sub vmconfig_cleanup_pending {
     return $changes;
 }
 
-my $valid_smbios1_options = {
-    manufacturer => '\S+',
-    product => '\S+',
-    version => '\S+',
-    serial => '\S+',
-    uuid => '[a-fA-F0-9]{8}(?:-[a-fA-F0-9]{4}){3}-[a-fA-F0-9]{12}',
-    sku => '\S+',
-    family => '\S+',
+# smbios: [manufacturer=str][,product=str][,version=str][,serial=str][,uuid=uuid][,sku=str][,family=str]
+my $smbios1_desc = {
+    uuid => {
+       type => 'string',
+       pattern => '[a-fA-F0-9]{8}(?:-[a-fA-F0-9]{4}){3}-[a-fA-F0-9]{12}',
+       format_description => 'UUID',
+       optional => 1,
+    },
+    version => {
+       type => 'string',
+       pattern => '\S+',
+       format_description => 'str',
+       optional => 1,
+    },
+    serial => {
+       type => 'string',
+       pattern => '\S+',
+       format_description => 'str',
+       optional => 1,
+    },
+    manufacturer => {
+       type => 'string',
+       pattern => '\S+',
+       format_description => 'name',
+       optional => 1,
+    },
+    product => {
+       type => 'string',
+       pattern => '\S+',
+       format_description => 'name',
+       optional => 1,
+    },
+    sku => {
+       type => 'string',
+       pattern => '\S+',
+       format_description => 'str',
+       optional => 1,
+    },
+    family => {
+       type => 'string',
+       pattern => '\S+',
+       format_description => 'str',
+       optional => 1,
+    },
 };
 
-# smbios: [manufacturer=str][,product=str][,version=str][,serial=str][,uuid=uuid][,sku=str][,family=str]
 sub parse_smbios1 {
     my ($data) = @_;
 
-    my $res = {};
-
-    foreach my $kvp (split(/,/, $data)) {
-       return undef if $kvp !~ m/^(\S+)=(.+)$/;
-       my ($k, $v) = split(/=/, $kvp);
-       return undef if !defined($k) || !defined($v);
-       return undef if !$valid_smbios1_options->{$k};
-       return undef if $v !~ m/^$valid_smbios1_options->{$k}$/;
-       $res->{$k} = $v;
-    }
-
+    my $res = eval { PVE::JSONSchema::parse_property_string($smbios1_desc, $data) };
+    warn $@ if $@;
     return $res;
 }
 
 sub print_smbios1 {
     my ($smbios1) = @_;
-
-    my $data = '';
-    foreach my $k (keys %$smbios1) {
-       next if !defined($smbios1->{$k});
-       next if !$valid_smbios1_options->{$k};
-       $data .= ',' if $data;
-       $data .= "$k=$smbios1->{$k}";
-    }
-    return $data;
+    return PVE::JSONSchema::print_property_string($smbios1, $smbios1_desc);
 }
 
-PVE::JSONSchema::register_format('pve-qm-smbios1', \&verify_smbios1);
-sub verify_smbios1 {
-    my ($value, $noerr) = @_;
-
-    return $value if parse_smbios1($value);
-
-    return undef if $noerr;
-
-    die "unable to parse smbios (type 1) options\n";
-}
+PVE::JSONSchema::register_format('pve-qm-smbios1', $smbios1_desc);
 
 PVE::JSONSchema::register_format('pve-qm-bootdisk', \&verify_bootdisk);
 sub verify_bootdisk {
@@ -1637,17 +1764,6 @@ sub verify_net {
     die "unable to parse network options\n";
 }
 
-PVE::JSONSchema::register_format('pve-qm-drive', \&verify_drive);
-sub verify_drive {
-    my ($value, $noerr) = @_;
-
-    return $value if parse_drive(undef, $value);
-
-    return undef if $noerr;
-
-    die "unable to parse drive options\n";
-}
-
 PVE::JSONSchema::register_format('pve-qm-hostpci', \&verify_hostpci);
 sub verify_hostpci {
     my ($value, $noerr) = @_;
@@ -1930,7 +2046,7 @@ sub parse_vm_config {
     my $vmid = $1;
 
     my $conf = $res;
-    my $descr = '';
+    my $descr;
     my $section = '';
 
     my @lines = split(/\n/, $raw);
@@ -1939,25 +2055,33 @@ sub parse_vm_config {
 
        if ($line =~ m/^\[PENDING\]\s*$/i) {
            $section = 'pending';
-           $conf->{description} = $descr if $descr;
-           $descr = '';
+           if (defined($descr)) {
+               $descr =~ s/\s+$//;
+               $conf->{description} = $descr;
+           }
+           $descr = undef;
            $conf = $res->{$section} = {};
            next;
 
        } elsif ($line =~ m/^\[([a-z][a-z0-9_\-]+)\]\s*$/i) {
            $section = $1;
-           $conf->{description} = $descr if $descr;
-           $descr = '';
+           if (defined($descr)) {
+               $descr =~ s/\s+$//;
+               $conf->{description} = $descr;
+           }
+           $descr = undef;
            $conf = $res->{snapshots}->{$section} = {};
            next;
        }
 
        if ($line =~ m/^\#(.*)\s*$/) {
+           $descr = '' if !defined($descr);
            $descr .= PVE::Tools::decode_text($1) . "\n";
            next;
        }
 
        if ($line =~ m/^(description):\s*(.*\S)\s*$/) {
+           $descr = '' if !defined($descr);
            $descr .= PVE::Tools::decode_text($2);
        } elsif ($line =~ m/snapstate:\s*(prepare|delete)\s*$/) {
            $conf->{snapstate} = $1;
@@ -2000,8 +2124,10 @@ sub parse_vm_config {
        }
     }
 
-    $conf->{description} = $descr if $descr;
-
+    if (defined($descr)) {
+       $descr =~ s/\s+$//;
+       $conf->{description} = $descr;
+    }
     delete $res->{snapstate}; # just to be sure
 
     return $res;
@@ -2072,14 +2198,19 @@ sub write_vm_config {
     }
 
     my $generate_raw_config = sub {
-       my ($conf) = @_;
+       my ($conf, $pending) = @_;
 
        my $raw = '';
 
        # add description as comment to top of file
-       my $descr = $conf->{description} || '';
-       foreach my $cl (split(/\n/, $descr)) {
-           $raw .= '#' .  PVE::Tools::encode_text($cl) . "\n";
+       if (defined(my $descr = $conf->{description})) {
+           if ($descr) {
+               foreach my $cl (split(/\n/, $descr)) {
+                   $raw .= '#' .  PVE::Tools::encode_text($cl) . "\n";
+               }
+           } else {
+               $raw .= "#\n" if $pending;
+           }
        }
 
        foreach my $key (sort keys %$conf) {
@@ -2093,7 +2224,7 @@ sub write_vm_config {
 
     if (scalar(keys %{$conf->{pending}})){
        $raw .= "\n[PENDING]\n";
-       $raw .= &$generate_raw_config($conf->{pending});
+       $raw .= &$generate_raw_config($conf->{pending}, 1);
     }
 
     foreach my $snapname (sort keys %{$conf->{snapshots}}) {
@@ -2163,6 +2294,8 @@ sub check_local_resources {
 
     foreach my $k (keys %$conf) {
        next if $k =~ m/^usb/ && ($conf->{$k} eq 'spice');
+       # sockets are safe: they will recreated be on the target side post-migrate
+       next if $k =~ m/^serial/ && ($conf->{$k} eq 'socket');
        $loc_res = 1 if $k =~ m/^(usb|hostpci|serial|parallel)\d+$/;
     }
 
@@ -2401,6 +2534,12 @@ sub vmstatus {
 
        $d->{netout} += $netdev->{$dev}->{receive};
        $d->{netin} += $netdev->{$dev}->{transmit};
+
+       if ($full) {
+           $d->{nics}->{$dev}->{netout} = $netdev->{$dev}->{receive};
+           $d->{nics}->{$dev}->{netin} = $netdev->{$dev}->{transmit};
+       }
+
     }
 
     my $ctime = gettimeofday;
@@ -2469,6 +2608,7 @@ sub vmstatus {
            $d->{freemem} = $info->{free_mem};
        }
 
+       $d->{ballooninfo} = $info;
     };
 
     my $blockstatscb = sub {
@@ -2476,9 +2616,13 @@ sub vmstatus {
        my $data = $resp->{'return'} || [];
        my $totalrdbytes = 0;
        my $totalwrbytes = 0;
+
        for my $blockstat (@$data) {
            $totalrdbytes = $totalrdbytes + $blockstat->{stats}->{rd_bytes};
            $totalwrbytes = $totalwrbytes + $blockstat->{stats}->{wr_bytes};
+
+           $blockstat->{device} =~ s/drive-//;
+           $res->{$vmid}->{blockstat}->{$blockstat->{device}} = $blockstat->{stats};
        }
        $res->{$vmid}->{diskread} = $totalrdbytes;
        $res->{$vmid}->{diskwrite} = $totalwrbytes;
@@ -2538,6 +2682,27 @@ sub foreach_dimm {
     }
 }
 
+sub foreach_reverse_dimm {
+    my ($conf, $vmid, $memory, $sockets, $func) = @_;
+
+    my $dimm_id = 253;
+    my $current_size = 4177920;
+    my $dimm_size = 65536;
+    return if $current_size == $memory;
+
+    for (my $j = 0; $j < 8; $j++) {
+       for (my $i = 0; $i < 32; $i++) {
+           my $name = "dimm${dimm_id}";
+           $dimm_id--;
+           my $numanode = $i % $sockets;
+           $current_size -= $dimm_size;
+           &$func($conf, $vmid, $name, $dimm_size, $numanode, $current_size, $memory);
+           return  $current_size if $current_size <= $memory;
+       }
+       $dimm_size /= 2;
+    }
+}
+
 sub foreach_drive {
     my ($conf, $func) = @_;
 
@@ -2617,6 +2782,24 @@ sub config_to_command {
     my $q35 = machine_type_is_q35($conf);
     my $hotplug_features = parse_hotplug_features(defined($conf->{hotplug}) ? $conf->{hotplug} : '1');
     my $machine_type = $forcemachine || $conf->{machine};
+    my $use_old_bios_files = undef;
+    ($use_old_bios_files, $machine_type) = qemu_use_old_bios_files($machine_type);
+
+    my $cpuunits = defined($conf->{cpuunits}) ?
+            $conf->{cpuunits} : $defaults->{cpuunits};
+
+    push @$cmd, '/usr/bin/systemd-run';
+    push @$cmd, '--scope';
+    push @$cmd, '--slice', "qemu";
+    push @$cmd, '--unit', $vmid;
+    # set KillMode=none, so that systemd don't kill those scopes
+    # at shutdown (pve-manager service should stop the VMs instead)
+    push @$cmd, '-p', "KillMode=none";
+    push @$cmd, '-p', "CPUShares=$cpuunits";
+    if ($conf->{cpulimit}) {
+       my $cpulimit = int($conf->{cpulimit} * 100);
+       push @$cmd, '-p', "CPUQuota=$cpulimit\%";
+    }
 
     push @$cmd, '/usr/bin/kvm';
 
@@ -2639,6 +2822,15 @@ sub config_to_command {
        push @$cmd, '-smbios', "type=1,$conf->{smbios1}";
     }
 
+    if ($conf->{bios} && $conf->{bios} eq 'ovmf') {
+       my $ovmfvar = "OVMF_VARS-pure-efi.fd";
+       my $ovmfvar_src = "/usr/share/kvm/$ovmfvar";
+       my $ovmfvar_dst = "/tmp/$vmid-$ovmfvar";
+       PVE::Tools::file_copy($ovmfvar_src, $ovmfvar_dst, 256*1024);
+       push @$cmd, '-drive', "if=pflash,format=raw,readonly,file=/usr/share/kvm/OVMF-pure-efi.fd";
+       push @$cmd, '-drive', "if=pflash,format=raw,file=$ovmfvar_dst";
+    }
+
     if ($q35) {
        # the q35 chipset support native usb2, so we enable usb controller
        # by default for this machine type
@@ -2683,6 +2875,8 @@ sub config_to_command {
 
     push @$devices, '-device', print_tabletdevice_full($conf) if $tablet;
 
+    my $kvm_off = 0;
+    my $nohyperv;
     # host pci devices
     for (my $i = 0; $i < $MAX_HOSTPCI_DEVICES; $i++)  {
        my $d = parse_hostpci($conf->{"hostpci$i"});
@@ -2697,13 +2891,15 @@ sub config_to_command {
        }
 
        my $rombar = $d->{rombar} && $d->{rombar} eq 'off' ? ",rombar=0" : "";
-       my $driver = $d->{driver} && $d->{driver} eq 'vfio' ? "vfio-pci" : "pci-assign";
        my $xvga = $d->{'x-vga'} && $d->{'x-vga'} eq 'on' ? ",x-vga=on" : "";
        if ($xvga && $xvga ne '') {
-           push @$cpuFlags, 'kvm=off';
+           $kvm_off = 1;
            $vga = 'none';
+           $nohyperv = 1;
+           if ($conf->{bios} && $conf->{bios} eq 'ovmf') {
+               $xvga = "";
+           }
        }
-       $driver = "vfio-pci" if $xvga ne '';
        my $pcidevices = $d->{pciid};
        my $multifunction = 1 if @$pcidevices > 1;
 
@@ -2714,7 +2910,7 @@ sub config_to_command {
            $id .= ".$j" if $multifunction;
            my $addr = $pciaddr;
            $addr .= ".$j" if $multifunction;
-           my $devicestr = "$driver,host=$pcidevice->{id}.$pcidevice->{function},id=$id$addr";
+           my $devicestr = "vfio-pci,host=$pcidevice->{id}.$pcidevice->{function},id=$id$addr";
 
            if($j == 0){
                $devicestr .= "$rombar$xvga";
@@ -2782,7 +2978,7 @@ sub config_to_command {
 
     my $allowed_vcpus = $cpuinfo->{cpus};
 
-    die "MAX $maxcpus vcpus allowed per VM on this node\n"
+    die "MAX $allowed_vcpus vcpus allowed per VM on this node\n"
        if ($allowed_vcpus < $maxcpus);
 
     push @$cmd, '-smp', "$vcpus,sockets=$sockets,cores=$cores,maxcpus=$maxcpus";
@@ -2829,17 +3025,17 @@ sub config_to_command {
            push @$globalFlags, 'kvm-pit.lost_tick_policy=discard';
            push @$cmd, '-no-hpet';
            if (qemu_machine_feature_enabled ($machine_type, $kvmver, 2, 3)) {
-               push @$cpuFlags , 'hv_spinlocks=0x1fff' if !$nokvm;
-               push @$cpuFlags , 'hv_vapic' if !$nokvm;
-               push @$cpuFlags , 'hv_time' if !$nokvm;
+               push @$cpuFlags , 'hv_spinlocks=0x1fff' if !$nokvm && !$nohyperv;
+               push @$cpuFlags , 'hv_vapic' if !$nokvm && !$nohyperv;
+               push @$cpuFlags , 'hv_time' if !$nokvm && !$nohyperv;
 
            } else {
-               push @$cpuFlags , 'hv_spinlocks=0xffff' if !$nokvm;
+               push @$cpuFlags , 'hv_spinlocks=0xffff' if !$nokvm && !$nohyperv;
            }
        }
 
        if ($ost eq 'win7' || $ost eq 'win8') {
-           push @$cpuFlags , 'hv_relaxed' if !$nokvm;
+           push @$cpuFlags , 'hv_relaxed' if !$nokvm && !$nohyperv;
        }
     }
 
@@ -2862,25 +3058,35 @@ sub config_to_command {
     }
 
     my $cpu = $nokvm ? "qemu64" : "kvm64";
-    $cpu = $conf->{cpu} if $conf->{cpu};
+    if (my $cputype = $conf->{cpu}) {
+       my $cpuconf = PVE::JSONSchema::parse_property_string($cpudesc, $cputype)
+           or die "Cannot parse cpu description: $cputype\n";
+       $cpu = $cpuconf->{cputype};
+       $kvm_off = 1 if $cpuconf->{hidden};
+    }
 
     push @$cpuFlags , '+lahf_lm' if $cpu eq 'kvm64';
 
-    push @$cpuFlags , '+x2apic' if !$nokvm && $conf->{ostype} ne 'solaris';
-
-    push @$cpuFlags , '-x2apic' if $conf->{ostype} eq 'solaris';
+    push @$cpuFlags , '-x2apic'
+       if $conf->{ostype} && $conf->{ostype} eq 'solaris';
 
     push @$cpuFlags, '+sep' if $cpu eq 'kvm64' || $cpu eq 'kvm32';
 
+    push @$cpuFlags, '-rdtscp' if $cpu =~ m/^Opteron/;
+
     if (qemu_machine_feature_enabled ($machine_type, $kvmver, 2, 3)) {
 
        push @$cpuFlags , '+kvm_pv_unhalt' if !$nokvm;
        push @$cpuFlags , '+kvm_pv_eoi' if !$nokvm;
     }
 
+    push @$cpuFlags, 'enforce' if $cpu ne 'host' && !$nokvm;
+
+    push @$cpuFlags, 'kvm=off' if $kvm_off;
+
     $cpu .= "," . join(',', @$cpuFlags) if scalar(@$cpuFlags);
 
-    push @$cmd, '-cpu', "$cpu,enforce";
+    push @$cmd, '-cpu', $cpu;
 
     my $memory = $conf->{memory} || $defaults->{memory};
     my $static_memory = 0;
@@ -3024,7 +3230,7 @@ sub config_to_command {
        my $pfamily = PVE::Tools::get_host_address_family($nodename);
        $spice_port = PVE::Tools::next_spice_port($pfamily);
 
-       push @$devices, '-spice', "tls-port=${spice_port},addr=127.0.0.1,tls-ciphers=DES-CBC3-SHA,seamless-migration=on";
+       push @$devices, '-spice', "tls-port=${spice_port},addr=localhost,tls-ciphers=DES-CBC3-SHA,seamless-migration=on";
 
        push @$devices, '-device', "virtio-serial,id=spice$pciaddr";
        push @$devices, '-chardev', "spicevmc,id=vdagent,name=vdagent";
@@ -3129,7 +3335,7 @@ sub config_to_command {
          my $netdevfull = print_netdev_full($vmid,$conf,$d,"net$i");
          push @$devices, '-netdev', $netdevfull;
 
-         my $netdevicefull = print_netdevice_full($vmid,$conf,$d,"net$i",$bridges);
+         my $netdevicefull = print_netdevice_full($vmid, $conf, $d, "net$i", $bridges, $use_old_bios_files);
          push @$devices, '-device', $netdevicefull;
     }
 
@@ -3148,19 +3354,6 @@ sub config_to_command {
        }
     }
 
-    # hack: virtio with fairsched is unreliable, so we do not use fairsched
-    # when the VM uses virtio devices.
-    if (!$use_virtio && $have_ovz) {
-
-       my $cpuunits = defined($conf->{cpuunits}) ?
-           $conf->{cpuunits} : $defaults->{cpuunits};
-
-       push @$cmd, '-cpuunits', $cpuunits if $cpuunits;
-
-       # fixme: cpulimit is currently ignored
-       #push @$cmd, '-cpulimit', $conf->{cpulimit} if $conf->{cpulimit};
-    }
-
     # add custom args
     if ($conf->{args}) {
        my $aa = PVE::Tools::split_args($conf->{args});
@@ -3307,7 +3500,12 @@ sub vm_deviceplug {
     } elsif ($deviceid =~ m/^(net)(\d+)$/) {
 
         return undef if !qemu_netdevadd($vmid, $conf, $device, $deviceid);
-        my $netdevicefull = print_netdevice_full($vmid, $conf, $device, $deviceid);
+
+        my $machine_type = PVE::QemuServer::qemu_machine_pxe($vmid, $conf); 
+        my $use_old_bios_files = undef;
+        ($use_old_bios_files, $machine_type) = qemu_use_old_bios_files($machine_type);
+
+        my $netdevicefull = print_netdevice_full($vmid, $conf, $device, $deviceid, undef, $use_old_bios_files);
         qemu_deviceadd($vmid, $netdevicefull);
         eval { qemu_deviceaddverify($vmid, $deviceid); };
        if (my $err = $@) {
@@ -3564,7 +3762,7 @@ sub qemu_set_link_status {
 sub qemu_netdevadd {
     my ($vmid, $conf, $device, $deviceid) = @_;
 
-    my $netdev = print_netdev_full($vmid, $conf, $device, $deviceid);
+    my $netdev = print_netdev_full($vmid, $conf, $device, $deviceid, 1);
     my %options =  split(/[=,]/, $netdev);
 
     vm_mon_cmd($vmid, "netdev_add",  %options);
@@ -3617,41 +3815,100 @@ sub qemu_memory_hotplug {
     my $dimm_memory = $memory - $static_memory;
 
     die "memory can't be lower than $static_memory MB" if $value < $static_memory;
-    die "memory unplug is not yet available" if $value < $memory;
     die "you cannot add more memory than $MAX_MEM MB!\n" if $memory > $MAX_MEM;
 
 
     my $sockets = 1;
     $sockets = $conf->{sockets} if $conf->{sockets};
 
-    foreach_dimm($conf, $vmid, $value, $sockets, sub {
-       my ($conf, $vmid, $name, $dimm_size, $numanode, $current_size, $memory) = @_;
+    if($value > $memory) {
 
-           return if $current_size <= $conf->{memory};
+       foreach_dimm($conf, $vmid, $value, $sockets, sub {
+           my ($conf, $vmid, $name, $dimm_size, $numanode, $current_size, $memory) = @_;
 
-           eval { vm_mon_cmd($vmid, "object-add", 'qom-type' => "memory-backend-ram", id => "mem-$name", props => { size => int($dimm_size*1024*1024) } ) };
-           if (my $err = $@) {
-               eval { qemu_objectdel($vmid, "mem-$name"); };
-               die $err;
-           }
+               return if $current_size <= $conf->{memory};
 
-           eval { vm_mon_cmd($vmid, "device_add", driver => "pc-dimm", id => "$name", memdev => "mem-$name", node => $numanode) };
-           if (my $err = $@) {
-               eval { qemu_objectdel($vmid, "mem-$name"); };
-               die $err;
-           }
-           #update conf after each succesful module hotplug
-           $conf->{memory} = $current_size;
-           update_config_nolock($vmid, $conf, 1);
-    });
+               eval { vm_mon_cmd($vmid, "object-add", 'qom-type' => "memory-backend-ram", id => "mem-$name", props => { size => int($dimm_size*1024*1024) } ) };
+               if (my $err = $@) {
+                   eval { qemu_objectdel($vmid, "mem-$name"); };
+                   die $err;
+               }
+
+               eval { vm_mon_cmd($vmid, "device_add", driver => "pc-dimm", id => "$name", memdev => "mem-$name", node => $numanode) };
+               if (my $err = $@) {
+                   eval { qemu_objectdel($vmid, "mem-$name"); };
+                   die $err;
+               }
+               #update conf after each succesful module hotplug
+               $conf->{memory} = $current_size;
+               update_config_nolock($vmid, $conf, 1);
+       });
+
+    } else {
+
+       foreach_reverse_dimm($conf, $vmid, $value, $sockets, sub {
+           my ($conf, $vmid, $name, $dimm_size, $numanode, $current_size, $memory) = @_;
+
+               return if $current_size >= $conf->{memory};
+               print "try to unplug memory dimm $name\n";
+
+               my $retry = 0;
+               while (1) {
+                   eval { qemu_devicedel($vmid, $name) };
+                   sleep 3;
+                   my $dimm_list = qemu_dimm_list($vmid);
+                   last if !$dimm_list->{$name};
+                   raise_param_exc({ $name => "error unplug memory module" }) if $retry > 5;
+                   $retry++;
+               }
+
+               #update conf after each succesful module unplug
+               $conf->{memory} = $current_size;
+
+               eval { qemu_objectdel($vmid, "mem-$name"); };
+               update_config_nolock($vmid, $conf, 1);
+       });
+    }
+}
+
+sub qemu_dimm_list {
+    my ($vmid) = @_;
+
+    my $dimmarray = vm_mon_cmd_nocheck($vmid, "query-memory-devices");
+    my $dimms = {};
+
+    foreach my $dimm (@$dimmarray) {
+
+        $dimms->{$dimm->{data}->{id}}->{id} = $dimm->{data}->{id};
+        $dimms->{$dimm->{data}->{id}}->{node} = $dimm->{data}->{node};
+        $dimms->{$dimm->{data}->{id}}->{addr} = $dimm->{data}->{addr};
+        $dimms->{$dimm->{data}->{id}}->{size} = $dimm->{data}->{size};
+        $dimms->{$dimm->{data}->{id}}->{slot} = $dimm->{data}->{slot};
+    }
+    return $dimms;
 }
 
 sub qemu_block_set_io_throttle {
-    my ($vmid, $deviceid, $bps, $bps_rd, $bps_wr, $iops, $iops_rd, $iops_wr) = @_;
+    my ($vmid, $deviceid,
+       $bps, $bps_rd, $bps_wr, $iops, $iops_rd, $iops_wr,
+       $bps_max, $bps_rd_max, $bps_wr_max, $iops_max, $iops_rd_max, $iops_wr_max) = @_;
 
     return if !check_running($vmid) ;
 
-    vm_mon_cmd($vmid, "block_set_io_throttle", device => $deviceid, bps => int($bps), bps_rd => int($bps_rd), bps_wr => int($bps_wr), iops => int($iops), iops_rd => int($iops_rd), iops_wr => int($iops_wr));
+    vm_mon_cmd($vmid, "block_set_io_throttle", device => $deviceid,
+       bps => int($bps),
+       bps_rd => int($bps_rd),
+       bps_wr => int($bps_wr),
+       iops => int($iops),
+       iops_rd => int($iops_rd),
+       iops_wr => int($iops_wr),
+       bps_max => int($bps_max),
+       bps_rd_max => int($bps_rd_max),
+       bps_wr_max => int($bps_wr_max),
+       iops_max => int($iops_max),
+       iops_rd_max => int($iops_rd_max),
+       iops_wr_max => int($iops_wr_max)
+    );
 
 }
 
@@ -3807,9 +4064,10 @@ sub set_migration_caps {
 
     my $enabled_cap = {
        "auto-converge" => 1,
-       "xbzrle" => 0,
+       "xbzrle" => 1,
        "x-rdma-pin-all" => 0,
        "zero-blocks" => 0,
+       "compress" => 0
     };
 
     my $supported_capabilities = vm_mon_cmd_nocheck($vmid, "query-migrate-capabilities");
@@ -3830,6 +4088,7 @@ my $fast_plug_option = {
     'onboot' => 1,
     'shares' => 1,
     'startup' => 1,
+    'description' => 1,
 };
 
 # hotplug changes in [PENDING]
@@ -3866,8 +4125,8 @@ sub vmconfig_hotplug_pending {
 
     my $hotplug_features = parse_hotplug_features(defined($conf->{hotplug}) ? $conf->{hotplug} : '1');
 
-    my @delete = PVE::Tools::split_list($conf->{pending}->{delete});
-    foreach my $opt (@delete) {
+    my $pending_delete_hash = split_flagged_list($conf->{pending}->{delete});
+    while (my ($opt, $force) = each %$pending_delete_hash) {
        next if $selection && !$selection->{$opt};
        eval {
            if ($opt eq 'hotplug') {
@@ -3893,10 +4152,14 @@ sub vmconfig_hotplug_pending {
            } elsif (valid_drivename($opt)) {
                die "skip\n" if !$hotplug_features->{disk} || $opt =~ m/(ide|sata)(\d+)/;
                vm_deviceunplug($vmid, $conf, $opt);
-               vmconfig_register_unused_drive($storecfg, $vmid, $conf, parse_drive($opt, $conf->{$opt}));
+               vmconfig_delete_or_detach_drive($vmid, $storecfg, $conf, $opt, $force);
            } elsif ($opt =~ m/^memory$/) {
                die "skip\n" if !$hotplug_features->{memory};
                qemu_memory_hotplug($vmid, $conf, $defaults, $opt);
+           } elsif ($opt eq 'cpuunits') {
+               cgroups_write("cpu", $vmid, "cpu.shares", $defaults->{cpuunits});
+           } elsif ($opt eq 'cpulimit') {
+               cgroups_write("cpu", $vmid, "cpu.cfs_quota_us", -1);
            } else {
                die "skip\n";
            }
@@ -3950,6 +4213,11 @@ sub vmconfig_hotplug_pending {
            } elsif ($opt =~ m/^memory$/) { #dimms
                die "skip\n" if !$hotplug_features->{memory};
                $value = qemu_memory_hotplug($vmid, $conf, $defaults, $opt, $value);
+           } elsif ($opt eq 'cpuunits') {
+               cgroups_write("cpu", $vmid, "cpu.shares", $conf->{pending}->{$opt});
+           } elsif ($opt eq 'cpulimit') {
+               my $cpulimit = $conf->{pending}->{$opt} == 0 ? -1 : int($conf->{pending}->{$opt} * 100000);
+               cgroups_write("cpu", $vmid, "cpu.cfs_quota_us", $cpulimit);
            } else {
                die "skip\n";  # skip non-hot-pluggable options
            }
@@ -3966,20 +4234,59 @@ sub vmconfig_hotplug_pending {
     }
 }
 
+sub try_deallocate_drive {
+    my ($storecfg, $vmid, $conf, $key, $drive, $rpcenv, $authuser, $force) = @_;
+
+    if (($force || $key =~ /^unused/) && !drive_is_cdrom($drive, 1)) {
+       my $volid = $drive->{file};
+       if (vm_is_volid_owner($storecfg, $vmid, $volid)) {
+           my $sid = PVE::Storage::parse_volume_id($volid);
+           $rpcenv->check($authuser, "/storage/$sid", ['Datastore.AllocateSpace']);
+
+           # check if the disk is really unused
+           die "unable to delete '$volid' - volume is still in use (snapshot?)\n"
+               if is_volume_in_use($storecfg, $conf, $key, $volid);
+           PVE::Storage::vdisk_free($storecfg, $volid);
+           return 1;
+       } else {
+           # If vm is not owner of this disk remove from config
+           return 1;
+       }
+    }
+
+    return undef;
+}
+
+sub vmconfig_delete_or_detach_drive {
+    my ($vmid, $storecfg, $conf, $opt, $force) = @_;
+
+    my $drive = parse_drive($opt, $conf->{$opt});
+
+    my $rpcenv = PVE::RPCEnvironment::get();
+    my $authuser = $rpcenv->get_user();
+
+    if ($force) {
+       $rpcenv->check_vm_perm($authuser, $vmid, undef, ['VM.Config.Disk']);
+       try_deallocate_drive($storecfg, $vmid, $conf, $opt, $drive, $rpcenv, $authuser, $force);
+    } else {
+       vmconfig_register_unused_drive($storecfg, $vmid, $conf, $drive);
+    }
+}
+
 sub vmconfig_apply_pending {
     my ($vmid, $conf, $storecfg) = @_;
 
     # cold plug
 
-    my @delete = PVE::Tools::split_list($conf->{pending}->{delete});
-    foreach my $opt (@delete) { # delete
+    my $pending_delete_hash = split_flagged_list($conf->{pending}->{delete});
+    while (my ($opt, $force) = each %$pending_delete_hash) {
        die "internal error" if $opt =~ m/^unused/;
        $conf = load_config($vmid); # update/reload
        if (!defined($conf->{$opt})) {
            vmconfig_undelete_pending_option($conf, $opt);
            update_config_nolock($vmid, $conf, 1);
        } elsif (valid_drivename($opt)) {
-           vmconfig_register_unused_drive($storecfg, $vmid, $conf, parse_drive($opt, $conf->{$opt}));
+           vmconfig_delete_or_detach_drive($vmid, $storecfg, $conf, $opt, $force);
            vmconfig_undelete_pending_option($conf, $opt);
            delete $conf->{$opt};
            update_config_nolock($vmid, $conf, 1);
@@ -4057,9 +4364,10 @@ sub vmconfig_update_net {
 
            if (&$safe_string_ne($oldnet->{bridge}, $newnet->{bridge}) ||
                &$safe_num_ne($oldnet->{tag}, $newnet->{tag}) ||
+               &$safe_string_ne($oldnet->{trunks}, $newnet->{trunks}) ||
                &$safe_num_ne($oldnet->{firewall}, $newnet->{firewall})) {
                PVE::Network::tap_unplug($iface);
-               PVE::Network::tap_plug($iface, $newnet->{bridge}, $newnet->{tag}, $newnet->{firewall});
+               PVE::Network::tap_plug($iface, $newnet->{bridge}, $newnet->{tag}, $newnet->{firewall}, $newnet->{trunks});
            }
 
            if (&$safe_string_ne($oldnet->{link_down}, $newnet->{link_down})) {
@@ -4163,11 +4471,13 @@ sub vmconfig_update_disk {
 
     die "skip\n" if !$hotplug || $opt =~ m/(ide|sata)(\d+)/;
     # hotplug new disks
+    PVE::Storage::activate_volumes($storecfg, [$drive->{file}]);
     vm_deviceplug($storecfg, $conf, $vmid, $opt, $drive);
 }
 
 sub vm_start {
-    my ($storecfg, $vmid, $statefile, $skiplock, $migratedfrom, $paused, $forcemachine, $spice_ticket) = @_;
+    my ($storecfg, $vmid, $statefile, $skiplock, $migratedfrom, $paused,
+       $forcemachine, $spice_ticket) = @_;
 
     lock_config($vmid, sub {
        my $conf = load_config($vmid, $migratedfrom);
@@ -4199,10 +4509,11 @@ sub vm_start {
                my $nodename = PVE::INotify::nodename();
                if ($datacenterconf->{migration_unsecure}) {
                        $localip = PVE::Cluster::remote_node_ip($nodename, 1);
+                       $localip = "[$localip]" if Net::IP::ip_is_ipv6($localip);
                }
                my $pfamily = PVE::Tools::get_host_address_family($nodename);
                $migrate_port = PVE::Tools::next_migrate_port($pfamily);
-               $migrate_uri = "tcp:[${localip}]:${migrate_port}";
+               $migrate_uri = "tcp:${localip}:${migrate_port}";
                push @$cmd, '-incoming', $migrate_uri;
                push @$cmd, '-S';
            } else {
@@ -4223,13 +4534,7 @@ sub vm_start {
                my $info = pci_device_info("0000:$pciid");
                die "IOMMU not present\n" if !check_iommu_support();
                die "no pci device info for device '$pciid'\n" if !$info;
-
-               if ($d->{driver} && $d->{driver} eq "vfio") {
-                   die "can't unbind/bind pci group to vfio '$pciid'\n" if !pci_dev_group_bind_to_vfio($pciid);
-               } else {
-                   die "can't unbind/bind to stub pci device '$pciid'\n" if !pci_dev_bind_to_stub($info);
-               }
-
+               die "can't unbind/bind pci group to vfio '$pciid'\n" if !pci_dev_group_bind_to_vfio($pciid);
                die "can't reset pci device '$pciid'\n" if $info->{has_fl_reset} and !pci_dev_reset($info);
          }
         }
@@ -4393,7 +4698,6 @@ sub vm_stop_cleanup {
     my ($storecfg, $vmid, $conf, $keepActive, $apply_pending_changes) = @_;
 
     eval {
-       fairsched_rmnod($vmid); # try to destroy group
 
        if (!$keepActive) {
            my $vollist = get_vm_volumes($conf);
@@ -4435,7 +4739,7 @@ sub vm_stop {
            $conf = load_config($vmid);
            check_lock($conf) if !$skiplock;
            if (!defined($timeout) && $shutdown && $conf->{startup}) {
-               my $opts = parse_startup($conf->{startup});
+               my $opts = PVE::JSONSchema::pve_parse_startup_order($conf->{startup});
                $timeout = $opts->{down} if $opts->{down};
            }
        }
@@ -4515,15 +4819,21 @@ sub vm_suspend {
 }
 
 sub vm_resume {
-    my ($vmid, $skiplock) = @_;
+    my ($vmid, $skiplock, $nocheck) = @_;
 
     lock_config($vmid, sub {
 
-       my $conf = load_config($vmid);
+       if (!$nocheck) {
 
-       check_lock($conf) if !($skiplock || ($conf->{lock} && $conf->{lock} eq 'backup'));
+           my $conf = load_config($vmid);
 
-       vm_mon_cmd($vmid, "cont");
+           check_lock($conf) if !($skiplock || ($conf->{lock} && $conf->{lock} eq 'backup'));
+
+           vm_mon_cmd($vmid, "cont");
+
+       } else {
+           vm_mon_cmd_nocheck($vmid, "cont");
+       }
     });
 }
 
@@ -4549,7 +4859,6 @@ sub vm_destroy {
        check_lock($conf) if !$skiplock;
 
        if (!check_running($vmid)) {
-           fairsched_rmnod($vmid); # try to destroy group
            destroy_vm($storecfg, $vmid);
        } else {
            die "VM $vmid is running - destroy failed\n";
@@ -4614,30 +4923,6 @@ sub pci_dev_reset {
     return file_write($fn, "1");
 }
 
-sub pci_dev_bind_to_stub {
-    my ($dev) = @_;
-
-    my $name = $dev->{name};
-
-    my $testdir = "$pcisysfs/drivers/pci-stub/$name";
-    return 1 if -d $testdir;
-
-    my $data = "$dev->{vendor} $dev->{product}";
-    return undef if !file_write("$pcisysfs/drivers/pci-stub/new_id", $data);
-
-    my $fn = "$pcisysfs/devices/$name/driver/unbind";
-    if (!file_write($fn, $name)) {
-       return undef if -f $fn;
-    }
-
-    $fn = "$pcisysfs/drivers/pci-stub/bind";
-    if (! -d $testdir) {
-       return undef if !file_write($fn, $name);
-    }
-
-    return -d $testdir;
-}
-
 sub pci_dev_bind_to_vfio {
     my ($dev) = @_;
 
@@ -4983,10 +5268,10 @@ sub scan_volids {
     return $volid_hash;
 }
 
-sub get_used_paths {
-    my ($vmid, $storecfg, $conf, $scan_snapshots, $skip_drive) = @_;
+sub is_volume_in_use {
+    my ($storecfg, $conf, $skip_drive, $volid) = @_;
 
-    my $used_path = {};
+    my $path = PVE::Storage::path($storecfg, $volid);
 
     my $scan_config = sub {
        my ($cref, $snapname) = @_;
@@ -4997,31 +5282,31 @@ sub get_used_paths {
                next if $skip_drive && $key eq $skip_drive;
                my $drive = parse_drive($key, $value);
                next if !$drive || !$drive->{file} || drive_is_cdrom($drive);
+               return 1 if $volid eq $drive->{file};
                if ($drive->{file} =~ m!^/!) {
-                   $used_path->{$drive->{file}}++; # = 1;
+                   return 1 if $drive->{file} eq $path;
                } else {
                    my ($storeid, $volname) = PVE::Storage::parse_volume_id($drive->{file}, 1);
                    next if !$storeid;
                    my $scfg = PVE::Storage::storage_config($storecfg, $storeid, 1);
                    next if !$scfg;
-                   my $path = PVE::Storage::path($storecfg, $drive->{file}, $snapname);
-                   $used_path->{$path}++; # = 1;
+                   return 1 if $path eq PVE::Storage::path($storecfg, $drive->{file}, $snapname);
                }
            }
        }
+
+       return 0;
     };
 
-    &$scan_config($conf);
+    return 1 if &$scan_config($conf);
 
     undef $skip_drive;
 
-    if ($scan_snapshots) {
-       foreach my $snapname (keys %{$conf->{snapshots}}) {
-           &$scan_config($conf->{snapshots}->{$snapname}, $snapname);
-       }
+    foreach my $snapname (keys %{$conf->{snapshots}}) {
+       return 1 if &$scan_config($conf->{snapshots}->{$snapname}, $snapname);
     }
 
-    return $used_path;
+    return 0;
 }
 
 sub update_disksize {
@@ -5190,6 +5475,10 @@ sub restore_vma_archive {
        my $fh = IO::File->new($cfgfn, "r") ||
            "unable to read qemu-server.conf - $!\n";
 
+       my $fwcfgfn = "$tmpdir/qemu-server.fw";
+       PVE::Tools::file_copy($fwcfgfn, "/etc/pve/firewall/$vmid.fw")
+           if -f $fwcfgfn;
+
        while (defined(my $line = <$fh>)) {
            if ($line =~ m/^\#qmdump\#map:(\S+):(\S+):(\S*):(\S*):$/) {
                my ($virtdev, $devname, $storeid, $format) = ($1, $2, $3, $4);
@@ -5263,6 +5552,8 @@ sub restore_vma_archive {
            $d->{volid} = $volid;
            my $path = PVE::Storage::path($cfg, $volid);
 
+           PVE::Storage::activate_volumes($cfg,[$volid]);
+
            my $write_zeros = 1;
            # fixme: what other storages types initialize volumes with zero?
            if ($scfg->{type} eq 'dir' || $scfg->{type} eq 'nfs' || $scfg->{type} eq 'glusterfs' ||
@@ -5328,13 +5619,21 @@ sub restore_vma_archive {
 
     alarm($oldtimeout) if $oldtimeout;
 
+    my $vollist = [];
+    foreach my $devname (keys %$devinfo) {
+       my $volid = $devinfo->{$devname}->{volid};
+       push @$vollist, $volid if $volid;
+    }
+
+    my $cfg = cfs_read_file('storage.cfg');
+    PVE::Storage::deactivate_volumes($cfg, $vollist);
+
     unlink $mapfifo;
 
     if ($err) {
        rmtree $tmpdir;
        unlink $tmpfn;
 
-       my $cfg = cfs_read_file('storage.cfg');
        foreach my $devname (keys %$devinfo) {
            my $volid = $devinfo->{$devname}->{volid};
            next if !$volid;
@@ -5781,7 +6080,8 @@ sub do_snapshots_with_qemu {
 
     my $storage_name = PVE::Storage::parse_volume_id($volid);
 
-    if ($qemu_snap_storage->{$storecfg->{ids}->{$storage_name}->{type}} ){
+    if ($qemu_snap_storage->{$storecfg->{ids}->{$storage_name}->{type}} 
+       && !$storecfg->{ids}->{$storage_name}->{krbd}){
        return 1;
     }
 
@@ -6036,6 +6336,9 @@ sub qemu_img_convert {
     my ($dst_storeid, $dst_volname) = PVE::Storage::parse_volume_id($dst_volid, 1);
 
     if ($src_storeid && $dst_storeid) {
+
+       PVE::Storage::activate_volumes($storecfg, [$src_volid], $snapname);
+
        my $src_scfg = PVE::Storage::storage_config($storecfg, $src_storeid);
        my $dst_scfg = PVE::Storage::storage_config($storecfg, $dst_storeid);
 
@@ -6071,10 +6374,8 @@ sub qemu_img_convert {
 sub qemu_img_format {
     my ($scfg, $volname) = @_;
 
-    if ($scfg->{path} && $volname =~ m/\.(raw|qcow2|qed|vmdk)$/) {
+    if ($scfg->{path} && $volname =~ m/\.(raw|cow|qcow|qcow2|qed|vmdk|cloop)$/) {
        return $1;
-    } elsif ($scfg->{type} eq 'iscsi') {
-       return "host_device";
     } else {
        return "raw";
     }
@@ -6088,24 +6389,17 @@ sub qemu_drive_mirror {
 
     my $dst_scfg = PVE::Storage::storage_config($storecfg, $dst_storeid);
 
-    my $format;
-    if ($dst_volname =~ m/\.(raw|qcow2)$/){
-       $format = $1;
-    }
+    my $format = qemu_img_format($dst_scfg, $dst_volname);
 
     my $dst_path = PVE::Storage::path($storecfg, $dst_volid);
 
-    #drive-mirror is doing lseek on source image before starting, and this can take a lot of time for big nfs volume
-    #during this time, qmp socket is hanging
-    #http://lists.nongnu.org/archive/html/qemu-devel/2015-05/msg01838.html
-    #so we need to setup a big timeout
-    my $opts = { timeout => 14400, device => "drive-$drive", mode => "existing", sync => "full", target => $dst_path };
+    my $opts = { timeout => 10, device => "drive-$drive", mode => "existing", sync => "full", target => $dst_path };
     $opts->{format} = $format if $format;
 
-    print "drive mirror is starting : this step can take some minutes/hours, depend of disk size and storage speed\n";
+    print "drive mirror is starting (scanning bitmap) : this step can take some minutes/hours, depend of disk size and storage speed\n";
 
-    vm_mon_cmd($vmid, "drive-mirror", %$opts);
     eval {
+    vm_mon_cmd($vmid, "drive-mirror", %$opts);
        while (1) {
            my $stats = vm_mon_cmd($vmid, "query-block-jobs");
            my $stat = @$stats[0];
@@ -6177,7 +6471,8 @@ sub clone_disk {
 
        my ($defFormat, $validFormats) = PVE::Storage::storage_default_format($storecfg, $storeid);
        if (!$format) {
-           $format = $drive->{format} || $defFormat;
+           my $scfg = PVE::Storage::storage_config($storecfg, $storeid);
+           $format = qemu_img_format($scfg, $volname);
        }
 
        # test if requested format is supported - else use default
@@ -6190,6 +6485,8 @@ sub clone_disk {
        $newvolid = PVE::Storage::vdisk_alloc($storecfg, $storeid, $newvmid, $format, undef, ($size/1024));
        push @$newvollist, $newvolid;
 
+       PVE::Storage::activate_volumes($storecfg, $newvollist);
+
        if (!$running || $snapname) {
            qemu_img_convert($drive->{file}, $newvolid, $size, $snapname);
        } else {
@@ -6246,6 +6543,43 @@ sub qemu_machine_feature_enabled {
 
 }
 
+sub qemu_machine_pxe {
+    my ($vmid, $conf, $machine) = @_;
+
+    $machine =  PVE::QemuServer::get_current_qemu_machine($vmid) if !$machine;
+
+    foreach my $opt (keys %$conf) {
+       next if $opt !~ m/^net(\d+)$/;
+       my $net = PVE::QemuServer::parse_net($conf->{$opt});
+       next if !$net;
+       my $romfile = PVE::QemuServer::vm_mon_cmd_nocheck($vmid, 'qom-get', path => $opt, property => 'romfile');
+       return $machine.".pxe" if $romfile =~ m/pxe/;
+       last;
+    }
+
+}
+
+sub qemu_use_old_bios_files {
+    my ($machine_type) = @_;
+
+    return if !$machine_type;
+
+    my $use_old_bios_files = undef;
+
+    if ($machine_type =~ m/^(\S+)\.pxe$/) {
+        $machine_type = $1;
+        $use_old_bios_files = 1;
+    } else {
+        # Note: kvm version < 2.4 use non-efi pxe files, and have problems when we
+        # load new efi bios files on migration. So this hack is required to allow
+        # live migration from qemu-2.2 to qemu-2.4, which is sometimes used when
+        # updrading from proxmox-ve-3.X to proxmox-ve 4.0
+        $use_old_bios_files = !qemu_machine_feature_enabled ($machine_type, undef, 2, 4);
+    }
+
+    return ($use_old_bios_files, $machine_type);
+}
+
 sub lspci {
 
     my $devices = {};
@@ -6291,4 +6625,77 @@ sub scsihw_infos {
     return ($maxdev, $controller, $controller_prefix);
 }
 
+# bash completion helper
+
+sub complete_backup_archives {
+    my ($cmdname, $pname, $cvalue) = @_;
+
+    my $cfg = PVE::Storage::config();
+
+    my $storeid;
+
+    if ($cvalue =~ m/^([^:]+):/) {
+       $storeid = $1;
+    }
+
+    my $data = PVE::Storage::template_list($cfg, $storeid, 'backup');
+
+    my $res = [];
+    foreach my $id (keys %$data) {
+       foreach my $item (@{$data->{$id}}) {
+           next if $item->{format} !~ m/^vma\.(gz|lzo)$/;
+           push @$res, $item->{volid} if defined($item->{volid});
+       }
+    }
+
+    return $res;
+}
+
+my $complete_vmid_full = sub {
+    my ($running) = @_;
+
+    my $idlist = vmstatus();
+
+    my $res = [];
+
+    foreach my $id (keys %$idlist) {
+       my $d = $idlist->{$id};
+       if (defined($running)) {
+           next if $d->{template};
+           next if $running && $d->{status} ne 'running';
+           next if !$running && $d->{status} eq 'running';
+       }
+       push @$res, $id;
+
+    }
+    return $res;
+};
+
+sub complete_vmid {
+    return &$complete_vmid_full();
+}
+
+sub complete_vmid_stopped {
+    return &$complete_vmid_full(0);
+}
+
+sub complete_vmid_running {
+    return &$complete_vmid_full(1);
+}
+
+sub complete_storage {
+
+    my $cfg = PVE::Storage::config();
+    my $ids = $cfg->{ids};
+
+    my $res = [];
+    foreach my $sid (keys %$ids) {
+       next if !PVE::Storage::storage_check_enabled($cfg, $sid, undef, 1);
+       next if !$ids->{$sid}->{content}->{images};
+       push @$res, $sid;
+    }
+
+    return $res;
+}
+
 1;