]> git.proxmox.com Git - qemu-server.git/blobdiff - PVE/QemuServer.pm
Use default values from load_defaults() when none is specified in conf
[qemu-server.git] / PVE / QemuServer.pm
index 102e5f1412af6a930d9e2903e292cbb1c79afa38..42c412a72e4aafc53cfbfbff37de7f48cb7f9b75 100644 (file)
@@ -27,10 +27,18 @@ use PVE::JSONSchema qw(get_standard_option);
 use PVE::Cluster qw(cfs_register_file cfs_read_file cfs_write_file cfs_lock_file);
 use PVE::INotify;
 use PVE::ProcFSTools;
+use PVE::QemuConfig;
 use PVE::QMPClient;
 use PVE::RPCEnvironment;
+use PVE::QemuServer::PCI qw(print_pci_addr print_pcie_addr);
+use PVE::QemuServer::Memory;
+use PVE::QemuServer::USB qw(parse_usb_device);
 use Time::HiRes qw(gettimeofday);
 use File::Copy qw(copy);
+use URI::Escape;
+
+my $OVMF_CODE = '/usr/share/kvm/OVMF_CODE-pure-efi.fd';
+my $OVMF_VARS = '/usr/share/kvm/OVMF_VARS-pure-efi.fd';
 
 my $qemu_snap_storage = {rbd => 1, sheepdog => 1};
 
@@ -47,12 +55,6 @@ cfs_register_file('/qemu-server/',
                  \&parse_vm_config,
                  \&write_vm_config);
 
-PVE::JSONSchema::register_standard_option('skiplock', {
-    description => "Ignore locks - only root is allowed to use this option.",
-    type => 'boolean',
-    optional => 1,
-});
-
 PVE::JSONSchema::register_standard_option('pve-qm-stateuri', {
     description => "Some command save/restore state from this location.",
     type => 'string',
@@ -66,6 +68,13 @@ PVE::JSONSchema::register_standard_option('pve-snapshot-name', {
     maxLength => 40,
 });
 
+PVE::JSONSchema::register_standard_option('pve-qm-image-format', {
+    type => 'string',
+    enum => [qw(raw cow qcow qed qcow2 vmdk cloop)],
+    description => "The drive's backing file's data format.",
+    optional => 1,
+});
+
 #no warnings 'redefine';
 
 sub cgroups_write {
@@ -90,11 +99,48 @@ mkdir $lock_dir;
 
 my $pcisysfs = "/sys/bus/pci";
 
-my $cpudesc = {
+my $cpu_vendor_list = {
+    # Intel CPUs
+    486 => 'GenuineIntel',
+    pentium => 'GenuineIntel',
+    pentium2  => 'GenuineIntel',
+    pentium3  => 'GenuineIntel',
+    coreduo => 'GenuineIntel',
+    core2duo => 'GenuineIntel',
+    Conroe  => 'GenuineIntel',
+    Penryn  => 'GenuineIntel', 
+    Nehalem  => 'GenuineIntel',
+    Westmere => 'GenuineIntel',
+    SandyBridge => 'GenuineIntel',
+    IvyBridge => 'GenuineIntel',
+    Haswell => 'GenuineIntel',
+    'Haswell-noTSX' => 'GenuineIntel',
+    Broadwell => 'GenuineIntel',
+    'Broadwell-noTSX' => 'GenuineIntel',
+    'Skylake-Client' => 'GenuineIntel',
+    
+    # AMD CPUs
+    athlon => 'AuthenticAMD',
+    phenom  => 'AuthenticAMD',
+    Opteron_G1  => 'AuthenticAMD',
+    Opteron_G2  => 'AuthenticAMD',
+    Opteron_G3  => 'AuthenticAMD',
+    Opteron_G4  => 'AuthenticAMD',
+    Opteron_G5  => 'AuthenticAMD',
+
+    # generic types, use vendor from host node
+    host => 'default',
+    kvm32 => 'default',
+    kvm64 => 'default',
+    qemu32 => 'default',
+    qemu64 => 'default',
+};
+
+my $cpu_fmt = {
     cputype => {
        description => "Emulated CPU type.",
        type => 'string',
-       enum => [ qw(486 athlon pentium pentium2 pentium3 coreduo core2duo kvm32 kvm64 qemu32 qemu64 phenom Conroe Penryn Nehalem Westmere SandyBridge IvyBridge Haswell Haswell-noTSX Broadwell Broadwell-noTSX Opteron_G1 Opteron_G2 Opteron_G3 Opteron_G4 Opteron_G5 host) ],
+       enum => [ sort { "\L$a" cmp "\L$b" } keys %$cpu_vendor_list ],
        default => 'kvm64',
        default_key => 1,
     },
@@ -106,6 +152,24 @@ my $cpudesc = {
     },
 };
 
+my $watchdog_fmt = {
+    model => {
+       default_key => 1,
+       type => 'string',
+       enum => [qw(i6300esb ib700)],
+       description => "Watchdog type to emulate.",
+       default => 'i6300esb',
+       optional => 1,
+    },
+    action => {
+       type => 'string',
+       enum => [qw(reset shutdown poweroff pause debug none)],
+       description => "The action to perform if after activation the guest fails to poll the watchdog in time.",
+       optional => 1,
+    },
+};
+PVE::JSONSchema::register_format('pve-qm-watchdog', $watchdog_fmt);
+
 my $confdesc = {
     onboot => {
        optional => 1,
@@ -140,18 +204,20 @@ my $confdesc = {
     cpulimit => {
        optional => 1,
        type => 'number',
-       description => "Limit of CPU usage. Note if the computer has 2 CPUs, it has total of '2' CPU time. Value '0' indicates no CPU limit.",
+       description => "Limit of CPU usage.",
+        verbose_description => "Limit of CPU usage.\n\nNOTE: If the computer has 2 CPUs, it has total of '2' CPU time. Value '0' indicates no CPU limit.",
        minimum => 0,
        maximum => 128,
-       default => 0,
+        default => 0,
     },
     cpuunits => {
        optional => 1,
        type => 'integer',
-       description => "CPU weight for a VM. Argument is used in the kernel fair scheduler. The larger the number is, the more CPU time this VM gets. Number is relative to weights of all the other running VMs.\n\nNOTE: You can disable fair-scheduler configuration by setting this to 0.",
-       minimum => 0,
-       maximum => 500000,
-       default => 1000,
+        description => "CPU weight for a VM.",
+       verbose_description => "CPU weight for a VM. Argument is used in the kernel fair scheduler. The larger the number is, the more CPU time this VM gets. Number is relative to weights of all the other running VMs.",
+       minimum => 2,
+       maximum => 262144,
+       default => 1024,
     },
     memory => {
        optional => 1,
@@ -177,9 +243,10 @@ my $confdesc = {
     keyboard => {
        optional => 1,
        type => 'string',
-       description => "Keybord layout for vnc server. Default is read from the datacenter configuration file.",
+       description => "Keybord layout for vnc server. Default is read from the '/etc/pve/datacenter.conf' configuration file.".
+                      "It should not be necessary to set it.",
        enum => PVE::Tools::kvmkeymaplist(),
-       default => 'en-us',
+       default => undef,
     },
     name => {
        optional => 1,
@@ -189,7 +256,7 @@ my $confdesc = {
     scsihw => {
        optional => 1,
        type => 'string',
-       description => "scsi controller model",
+       description => "SCSI controller model",
        enum => [qw(lsi lsi53c810 virtio-scsi-pci virtio-scsi-single megasas pvscsi)],
        default => 'lsi',
     },
@@ -201,25 +268,25 @@ my $confdesc = {
     ostype => {
        optional => 1,
        type => 'string',
-        enum => [qw(other wxp w2k w2k3 w2k8 wvista win7 win8 l24 l26 solaris)],
-       description => <<EODESC,
-Used to enable special optimization/features for specific
-operating systems:
-
-other  => unspecified OS
-wxp    => Microsoft Windows XP
-w2k    => Microsoft Windows 2000
-w2k3   => Microsoft Windows 2003
-w2k8   => Microsoft Windows 2008
-wvista => Microsoft Windows Vista
-win7   => Microsoft Windows 7
-win8   => Microsoft Windows 8/2012
-l24    => Linux 2.4 Kernel
-l26    => Linux 2.6/3.X Kernel
-solaris => solaris/opensolaris/openindiania kernel
-
-other|l24|l26|solaris                       ... no special behaviour
-wxp|w2k|w2k3|w2k8|wvista|win7|win8  ... use --localtime switch
+        enum => [qw(other wxp w2k w2k3 w2k8 wvista win7 win8 win10 l24 l26 solaris)],
+       description => "Specify guest operating system.",
+       verbose_description => <<EODESC,
+Specify guest operating system. This is used to enable special
+optimization/features for specific operating systems:
+
+[horizontal]
+other;; unspecified OS
+wxp;; Microsoft Windows XP
+w2k;; Microsoft Windows 2000
+w2k3;; Microsoft Windows 2003
+w2k8;; Microsoft Windows 2008
+wvista;; Microsoft Windows Vista
+win7;; Microsoft Windows 7
+win8;; Microsoft Windows 8/2012/2012r2
+win10;; Microsoft Windows 10/2016
+l24;; Linux 2.4 Kernel
+l26;; Linux 2.6/3.X Kernel
+solaris;; Solaris/OpenSolaris/OpenIndiania kernel
 EODESC
     },
     boot => {
@@ -259,9 +326,15 @@ EODESC
     numa => {
        optional => 1,
        type => 'boolean',
-       description => "Enable/disable Numa.",
+       description => "Enable/disable NUMA.",
        default => 0,
     },
+    hugepages => {
+       optional => 1,
+       type => 'string',
+       description => "Enable/disable hugepages memory.",
+       enum => [qw(any 2 1024)],
+    },
     vcpus => {
        optional => 1,
        type => 'integer',
@@ -306,14 +379,25 @@ EODESC
     vga => {
        optional => 1,
        type => 'string',
-       description => "Select VGA type. If you want to use high resolution modes (>= 1280x1024x16) then you should use option 'std' or 'vmware'. Default is 'std' for win8/win7/w2k8, and 'cirrur' for other OS types. Option 'qxl' enables the SPICE display sever. You can also run without any graphic card using a serial devive as terminal.",
+       description => "Select the VGA type.",
+        verbose_description => "Select the VGA type. If you want to use high resolution" .
+           " modes (>= 1280x1024x16) then you should use the options " .
+           "'std' or 'vmware'. Default is 'std' for win8/win7/w2k8, and " .
+           "'cirrus' for other OS types. The 'qxl' option enables the SPICE " .
+           "display sever. For win* OS you can select how many independent " .
+           "displays you want, Linux guests can add displays them self. " .
+           "You can also run without any graphic card, using a serial device" .
+           " as terminal.",
        enum => [qw(std cirrus vmware qxl serial0 serial1 serial2 serial3 qxl2 qxl3 qxl4)],
     },
     watchdog => {
        optional => 1,
        type => 'string', format => 'pve-qm-watchdog',
-       typetext => '[[model=]i6300esb|ib700] [,[action=]reset|shutdown|poweroff|pause|debug|none]',
-       description => "Create a virtual hardware watchdog device.  Once enabled (by a guest action), the watchdog must be periodically polled by an agent inside the guest or else the guest will be restarted (or execute the action specified)",
+       description => "Create a virtual hardware watchdog device.",
+       verbose_description => "Create a virtual hardware watchdog device. Once enabled" .
+           " (by a guest action), the watchdog must be periodically polled " .
+           "by an agent inside the guest or else the watchdog will reset " .
+           "the guest (or execute the respective action specified)",
     },
     startdate => {
        optional => 1,
@@ -333,17 +417,26 @@ EODESC
     args => {
        optional => 1,
        type => 'string',
-       description => <<EODESCR,
-Note: this option is for experts only. It allows you to pass arbitrary arguments to kvm, for example:
+       description => "Arbitrary arguments passed to kvm.",
+       verbose_description => <<EODESCR,
+Arbitrary arguments passed to kvm, for example:
 
 args: -no-reboot -no-hpet
+
+NOTE: this option is for experts only.
 EODESCR
     },
     tablet => {
        optional => 1,
        type => 'boolean',
        default => 1,
-       description => "Enable/disable the usb tablet device. This device is usually needed to allow absolute mouse positioning with VNC. Else the mouse runs out of sync with normal VNC clients. If you're running lots of console-only guests on one host, you may consider disabling this to save some context switches. This is turned of by default if you use spice (vga=qxl).",
+       description => "Enable/disable the USB tablet device.",
+       verbose_description => "Enable/disable the USB tablet device. This device is " .
+           "usually needed to allow absolute mouse positioning with VNC. " .
+           "Else the mouse runs out of sync with normal VNC clients. " .
+           "If you're running lots of console-only guests on one host, " .
+           "you may consider disabling this to save some context switches. " .
+           "This is turned off by default if you use spice (-vga=qxl).",
     },
     migrate_speed => {
        optional => 1,
@@ -361,15 +454,15 @@ EODESCR
     },
     cdrom => {
        optional => 1,
-       type => 'string', format => 'pve-qm-drive',
-       typetext => 'volume',
+       type => 'string', format => 'pve-qm-ide',
+       typetext => '<volume>',
        description => "This is an alias for option -ide2",
     },
     cpu => {
        optional => 1,
        description => "Emulated CPU type.",
        type => 'string',
-       format => $cpudesc,
+       format => $cpu_fmt,
     },
     parent => get_standard_option('pve-snapshot-name', {
        optional => 1,
@@ -386,6 +479,10 @@ EODESCR
        type => 'string', format => 'pve-volume-id',
        description => "Reference to a volume which stores the VM state. This is used internally for snapshots.",
     },
+    vmstatestorage => get_standard_option('pve-storage-id', {
+       description => "Default storage for VM state volumes/files.",
+       optional => 1,
+    }),
     machine => {
        description => "Specific the Qemu machine type.",
        type => 'string',
@@ -402,7 +499,7 @@ EODESCR
     protection => {
        optional => 1,
        type => 'boolean',
-       description => "Sets the protection flag of the VM. This will prevent the remove operation.",
+       description => "Sets the protection flag of the VM. This will disable the remove VM and remove disk operations.",
        default => 0,
     },
     bios => {
@@ -446,14 +543,38 @@ my $MAX_HOSTPCI_DEVICES = 4;
 my $MAX_SERIAL_PORTS = 4;
 my $MAX_PARALLEL_PORTS = 3;
 my $MAX_NUMA = 8;
-my $MAX_MEM = 4194304;
-my $STATICMEM = 1024;
 
+my $numa_fmt = {
+    cpus => {
+       type => "string",
+       pattern => qr/\d+(?:-\d+)?(?:;\d+(?:-\d+)?)*/,
+       description => "CPUs accessing this NUMA node.",
+       format_description => "id[-id];...",
+    },
+    memory => {
+       type => "number",
+       description => "Amount of memory this NUMA node provides.",
+       optional => 1,
+    },
+    hostnodes => {
+       type => "string",
+       pattern => qr/\d+(?:-\d+)?(?:;\d+(?:-\d+)?)*/,
+       description => "Host NUMA nodes to use.",
+       format_description => "id[-id];...",
+       optional => 1,
+    },
+    policy => {
+       type => 'string',
+       enum => [qw(preferred bind interleave)],
+       description => "NUMA allocation policy.",
+       optional => 1,
+    },
+};
+PVE::JSONSchema::register_format('pve-qm-numanode', $numa_fmt);
 my $numadesc = {
     optional => 1,
-    type => 'string', format => 'pve-qm-numanode',
-    typetext => "cpus=<id[-id],memory=<mb>[[,hostnodes=<id[-id]>] [,policy=<preferred|bind|interleave>]]",
-    description => "numa topology",
+    type => 'string', format => $numa_fmt,
+    description => "NUMA topology.",
 };
 PVE::JSONSchema::register_standard_option("pve-qm-numanode", $numadesc);
 
@@ -466,51 +587,121 @@ my $nic_model_list = ['rtl8139', 'ne2k_pci', 'e1000',  'pcnet',  'virtio',
                      'e1000-82540em', 'e1000-82544gc', 'e1000-82545em'];
 my $nic_model_list_txt = join(' ', sort @$nic_model_list);
 
-my $netdesc = {
-    optional => 1,
-    type => 'string', format => 'pve-qm-net',
-    typetext => "MODEL=XX:XX:XX:XX:XX:XX [,bridge=<dev>][,queues=<nbqueues>][,rate=<mbps>] [,tag=<vlanid>][,trunks=<vlanid[;vlanid]>][,firewall=0|1],link_down=0|1]",
-    description => <<EODESCR,
-Specify network devices.
-
-MODEL is one of: $nic_model_list_txt
-
-XX:XX:XX:XX:XX:XX should be an unique MAC address. This is
-automatically generated if not specified.
-
-The bridge parameter can be used to automatically add the interface to a bridge device. The Proxmox VE standard bridge is called 'vmbr0'.
-
-Option 'rate' is used to limit traffic bandwidth from and to this interface. It is specified as floating point number, unit is 'Megabytes per second'.
+my $net_fmt_bridge_descr = <<__EOD__;
+Bridge to attach the network device to. The Proxmox VE standard bridge
+is called 'vmbr0'.
 
-If you specify no bridge, we create a kvm 'user' (NATed) network device, which provides DHCP and DNS services. The following addresses are used:
+If you do not specify a bridge, we create a kvm user (NATed) network
+device, which provides DHCP and DNS services. The following addresses
+are used:
 
-10.0.2.2   Gateway
-10.0.2.3   DNS Server
-10.0.2.4   SMB Server
+ 10.0.2.2   Gateway
+ 10.0.2.3   DNS Server
+ 10.0.2.4   SMB Server
 
 The DHCP server assign addresses to the guest starting from 10.0.2.15.
+__EOD__
 
-EODESCR
+my $net_fmt = {
+    macaddr => {
+       type => 'string',
+       pattern => qr/[0-9a-f]{2}(?::[0-9a-f]{2}){5}/i,
+       description => "MAC address. That address must be unique withing your network. This is automatically generated if not specified.",
+       format_description => "XX:XX:XX:XX:XX:XX",
+       optional => 1,
+    },
+    model => {
+       type => 'string',
+       description => "Network Card Model. The 'virtio' model provides the best performance with very low CPU overhead. If your guest does not support this driver, it is usually best to use 'e1000'.",
+        enum => $nic_model_list,
+        default_key => 1,
+    },
+    (map { $_ => { keyAlias => 'model', alias => 'macaddr' }} @$nic_model_list),
+    bridge => {
+       type => 'string',
+       description => $net_fmt_bridge_descr,
+       format_description => 'bridge',
+       optional => 1,
+    },
+    queues => {
+       type => 'integer',
+       minimum => 0, maximum => 16,
+       description => 'Number of packet queues to be used on the device.',
+       optional => 1,
+    },
+    rate => {
+       type => 'number',
+       minimum => 0,
+       description => "Rate limit in mbps (megabytes per second) as floating point number.",
+       optional => 1,
+    },
+    tag => {
+       type => 'integer',
+       minimum => 1, maximum => 4094,
+       description => 'VLAN tag to apply to packets on this interface.',
+       optional => 1,
+    },
+    trunks => {
+       type => 'string',
+       pattern => qr/\d+(?:-\d+)?(?:;\d+(?:-\d+)?)*/,
+       description => 'VLAN trunks to pass through this interface.',
+       format_description => 'vlanid[;vlanid...]',
+       optional => 1,
+    },
+    firewall => {
+       type => 'boolean',
+       description => 'Whether this interface should be protected by the firewall.',
+       optional => 1,
+    },
+    link_down => {
+       type => 'boolean',
+       description => 'Whether this interface should be disconnected (like pulling the plug).',
+       optional => 1,
+    },
+};
+
+my $netdesc = {
+    optional => 1,
+    type => 'string', format => $net_fmt,
+    description => "Specify network devices.",
 };
+
 PVE::JSONSchema::register_standard_option("pve-qm-net", $netdesc);
 
 for (my $i = 0; $i < $MAX_NETS; $i++)  {
     $confdesc->{"net$i"} = $netdesc;
 }
 
+PVE::JSONSchema::register_format('pve-volume-id-or-qm-path', \&verify_volume_id_or_qm_path);
+sub verify_volume_id_or_qm_path {
+    my ($volid, $noerr) = @_;
+
+    if ($volid eq 'none' || $volid eq 'cdrom' || $volid =~ m|^/|) {
+       return $volid;
+    }
+
+    # if its neither 'none' nor 'cdrom' nor a path, check if its a volume-id
+    $volid = eval { PVE::JSONSchema::check_format('pve-volume-id', $volid, '') };
+    if ($@) {
+       return undef if $noerr;
+       die $@;
+    }
+    return $volid;
+}
+
 my $drivename_hash;
 
 my %drivedesc_base = (
     volume => { alias => 'file' },
     file => {
-       type => 'pve-volume-id',
+       type => 'string',
+       format => 'pve-volume-id-or-qm-path',
        default_key => 1,
        format_description => 'volume',
        description => "The drive's backing volume.",
     },
     media => {
        type => 'string',
-       format_description => 'cdrom|disk',
        enum => [qw(cdrom disk)],
        description => "The drive's media type.",
        default => 'disk',
@@ -518,78 +709,75 @@ my %drivedesc_base = (
     },
     cyls => {
        type => 'integer',
-       format_description => 'count',
        description => "Force the drive's physical geometry to have a specific cylinder count.",
        optional => 1
     },
     heads => {
        type => 'integer',
-       format_description => 'count',
        description => "Force the drive's physical geometry to have a specific head count.",
        optional => 1
     },
     secs => {
        type => 'integer',
-       format_description => 'count',
        description => "Force the drive's physical geometry to have a specific sector count.",
        optional => 1
     },
     trans => {
        type => 'string',
-       format_description => 'none|lba|auto',
        enum => [qw(none lba auto)],
        description => "Force disk geometry bios translation mode.",
        optional => 1,
     },
     snapshot => {
        type => 'boolean',
-       format_description => 'on|off',
        description => "Whether the drive should be included when making snapshots.",
        optional => 1,
     },
     cache => {
        type => 'string',
-       format_description => 'none|writethrough|writeback|unsafe|directsync',
        enum => [qw(none writethrough writeback unsafe directsync)],
        description => "The drive's cache mode",
        optional => 1,
     },
-    format => {
-       type => 'string',
-       format_description => 'drive format',
-       enum => [qw(raw cow qcow qed qcow2 vmdk cloop)],
-       description => "The drive's backing file's data format.",
-       optional => 1,
-    },
+    format => get_standard_option('pve-qm-image-format'),
     size => {
        type => 'string',
        format => 'disk-size',
+       format_description => 'DiskSize',
        description => "Disk size. This is purely informational and has no effect.",
        optional => 1,
     },
     backup => {
        type => 'boolean',
-       format_description => 'on|off',
        description => "Whether the drive should be included when making backups.",
        optional => 1,
     },
+    replicate => {
+       type => 'boolean',
+       description => 'Whether the drive should considered for replication jobs.',
+       optional => 1,
+       default => 1,
+    },
+    rerror => {
+       type => 'string',
+       enum => [qw(ignore report stop)],
+       description => 'Read error action.',
+       optional => 1,
+    },
     werror => {
        type => 'string',
-       format_description => 'enospc|ignore|report|stop',
        enum => [qw(enospc ignore report stop)],
        description => 'Write error action.',
        optional => 1,
     },
     aio => {
        type => 'string',
-       format_description => 'native|threads',
        enum => [qw(native threads)],
        description => 'AIO type to use.',
        optional => 1,
     },
     discard => {
        type => 'string',
-       format_description => 'ignore|on',
        enum => [qw(ignore on)],
        description => 'Controls whether to pass discard/trim requests to the underlying storage.',
        optional => 1,
@@ -601,25 +789,16 @@ my %drivedesc_base = (
     },
     serial => {
        type => 'string',
+       format => 'urlencoded',
        format_description => 'serial',
-       description => "The drive's reported serial number.",
+       maxLength => 20*3, # *3 since it's %xx url enoded
+       description => "The drive's reported serial number, url-encoded, up to 20 bytes long.",
        optional => 1,
     }
 );
 
-my %rerror_fmt = (
-    rerror => {
-       type => 'string',
-       format_description => 'ignore|report|stop',
-       enum => [qw(ignore report stop)],
-       description => 'Read error action.',
-       optional => 1,
-    },
-);
-
 my %iothread_fmt = ( iothread => {
        type => 'boolean',
-       format_description => 'off|on',
        description => "Whether to use iothreads for this drive",
        optional => 1,
 });
@@ -627,8 +806,10 @@ my %iothread_fmt = ( iothread => {
 my %model_fmt = (
     model => {
        type => 'string',
+       format => 'urlencoded',
        format_description => 'model',
-       description => "The drive's reported model name.",
+       maxLength => 40*3, # *3 since it's %xx url enoded
+       description => "The drive's reported model name, url-encoded, up to 40 bytes long.",
        optional => 1,
     },
 );
@@ -636,46 +817,70 @@ my %model_fmt = (
 my %queues_fmt = (
     queues => {
        type => 'integer',
-       format_description => 'nbqueues',
        description => "Number of queues.",
        minimum => 2,
        optional => 1
     }
 );
 
+my %scsiblock_fmt = (
+    scsiblock => {
+       type => 'boolean',
+       description => "whether to use scsi-block for full passthrough of host block device\n\nWARNING: can lead to I/O errors in combination with low memory or high memory fragmentation on host",
+       optional => 1,
+       default => 0,
+    },
+);
+
 my $add_throttle_desc = sub {
-    my ($key, $type, $what, $size, $longsize) = @_;
-    $drivedesc_base{$key} = {
+    my ($key, $type, $what, $unit, $longunit, $minimum) = @_;
+    my $d = {
        type => $type,
-       format_description => $size,
-       description => "Maximum $what speed in $longsize per second.",
+       format_description => $unit,
+       description => "Maximum $what in $longunit.",
        optional => 1,
     };
+    $d->{minimum} = $minimum if defined($minimum);
+    $drivedesc_base{$key} = $d;
 };
 # throughput: (leaky bucket)
-$add_throttle_desc->('bps',     'integer', 'r/w speed',   'bps',  'bytes');
-$add_throttle_desc->('bps_rd',  'integer', 'read speed',  'bps',  'bytes');
-$add_throttle_desc->('bps_wr',  'integer', 'write speed', 'bps',  'bytes');
-$add_throttle_desc->('mbps',    'float',   'r/w speed',   'mbps', 'megabytes');
-$add_throttle_desc->('mbps_rd', 'float',   'read speed',  'mbps', 'megabytes');
-$add_throttle_desc->('mbps_wr', 'float',   'write speed', 'mbps', 'megabytes');
-$add_throttle_desc->('iops',    'integer', 'r/w I/O',     'iops', 'operations');
-$add_throttle_desc->('iops_rd', 'integer', 'read I/O',    'iops', 'operations');
-$add_throttle_desc->('iops_wr', 'integer', 'write I/O',   'iops', 'operations');
+$add_throttle_desc->('bps',     'integer', 'r/w speed',   'bps',  'bytes per second');
+$add_throttle_desc->('bps_rd',  'integer', 'read speed',  'bps',  'bytes per second');
+$add_throttle_desc->('bps_wr',  'integer', 'write speed', 'bps',  'bytes per second');
+$add_throttle_desc->('mbps',    'number',  'r/w speed',   'mbps', 'megabytes per second');
+$add_throttle_desc->('mbps_rd', 'number',  'read speed',  'mbps', 'megabytes per second');
+$add_throttle_desc->('mbps_wr', 'number',  'write speed', 'mbps', 'megabytes per second');
+$add_throttle_desc->('iops',    'integer', 'r/w I/O',     'iops', 'operations per second');
+$add_throttle_desc->('iops_rd', 'integer', 'read I/O',    'iops', 'operations per second');
+$add_throttle_desc->('iops_wr', 'integer', 'write I/O',   'iops', 'operations per second');
 
 # pools: (pool of IO before throttling starts taking effect)
-$add_throttle_desc->('mbps_max',    'float',   'unthrottled r/w pool',       'mbps', 'megabytes');
-$add_throttle_desc->('mbps_rd_max', 'float',   'unthrottled read pool',      'mbps', 'megabytes');
-$add_throttle_desc->('mbps_wr_max', 'float',   'unthrottled write pool',     'mbps', 'megabytes');
-$add_throttle_desc->('iops_max',    'integer', 'unthrottled r/w I/O pool',   'iops', 'operations');
-$add_throttle_desc->('iops_rd_max', 'integer', 'unthrottled read I/O pool',  'iops', 'operations');
-$add_throttle_desc->('iops_wr_max', 'integer', 'unthrottled write I/O pool', 'iops', 'operations');
+$add_throttle_desc->('mbps_max',    'number',  'unthrottled r/w pool',       'mbps', 'megabytes per second');
+$add_throttle_desc->('mbps_rd_max', 'number',  'unthrottled read pool',      'mbps', 'megabytes per second');
+$add_throttle_desc->('mbps_wr_max', 'number',  'unthrottled write pool',     'mbps', 'megabytes per second');
+$add_throttle_desc->('iops_max',    'integer', 'unthrottled r/w I/O pool',   'iops', 'operations per second');
+$add_throttle_desc->('iops_rd_max', 'integer', 'unthrottled read I/O pool',  'iops', 'operations per second');
+$add_throttle_desc->('iops_wr_max', 'integer', 'unthrottled write I/O pool', 'iops', 'operations per second');
+
+# burst lengths
+$add_throttle_desc->('bps_max_length',     'integer', 'length of I/O bursts',       'seconds', 'seconds', 1);
+$add_throttle_desc->('bps_rd_max_length',  'integer', 'length of read I/O bursts',  'seconds', 'seconds', 1);
+$add_throttle_desc->('bps_wr_max_length',  'integer', 'length of write I/O bursts', 'seconds', 'seconds', 1);
+$add_throttle_desc->('iops_max_length',    'integer', 'length of I/O bursts',       'seconds', 'seconds', 1);
+$add_throttle_desc->('iops_rd_max_length', 'integer', 'length of read I/O bursts',  'seconds', 'seconds', 1);
+$add_throttle_desc->('iops_wr_max_length', 'integer', 'length of write I/O bursts', 'seconds', 'seconds', 1);
+
+# legacy support
+$drivedesc_base{'bps_rd_length'} = { alias => 'bps_rd_max_length' };
+$drivedesc_base{'bps_wr_length'} = { alias => 'bps_wr_max_length' };
+$drivedesc_base{'iops_rd_length'} = { alias => 'iops_rd_max_length' };
+$drivedesc_base{'iops_wr_length'} = { alias => 'iops_wr_max_length' };
 
 my $ide_fmt = {
     %drivedesc_base,
-    %rerror_fmt,
     %model_fmt,
 };
+PVE::JSONSchema::register_format("pve-qm-ide", $ide_fmt);
 
 my $idedesc = {
     optional => 1,
@@ -688,6 +893,7 @@ my $scsi_fmt = {
     %drivedesc_base,
     %iothread_fmt,
     %queues_fmt,
+    %scsiblock_fmt,
 };
 my $scsidesc = {
     optional => 1,
@@ -698,7 +904,6 @@ PVE::JSONSchema::register_standard_option("pve-qm-scsi", $scsidesc);
 
 my $sata_fmt = {
     %drivedesc_base,
-    %rerror_fmt,
 };
 my $satadesc = {
     optional => 1,
@@ -710,7 +915,6 @@ PVE::JSONSchema::register_standard_option("pve-qm-sata", $satadesc);
 my $virtio_fmt = {
     %drivedesc_base,
     %iothread_fmt,
-    %rerror_fmt,
 };
 my $virtiodesc = {
     optional => 1,
@@ -721,51 +925,129 @@ PVE::JSONSchema::register_standard_option("pve-qm-virtio", $virtiodesc);
 
 my $alldrive_fmt = {
     %drivedesc_base,
-    %rerror_fmt,
     %iothread_fmt,
     %model_fmt,
     %queues_fmt,
+    %scsiblock_fmt,
 };
 
-my $usbdesc = {
+my $efidisk_fmt = {
+    volume => { alias => 'file' },
+    file => {
+       type => 'string',
+       format => 'pve-volume-id-or-qm-path',
+       default_key => 1,
+       format_description => 'volume',
+       description => "The drive's backing volume.",
+    },
+    format => get_standard_option('pve-qm-image-format'),
+    size => {
+       type => 'string',
+       format => 'disk-size',
+       format_description => 'DiskSize',
+       description => "Disk size. This is purely informational and has no effect.",
+       optional => 1,
+    },
+};
+
+my $efidisk_desc = {
     optional => 1,
-    type => 'string', format => 'pve-qm-usb-device',
-    typetext => 'host=HOSTUSBDEVICE [,usb3=yes|no]|spice',
-    description => <<EODESCR,
-Configure an USB device (n is 0 to 4). This can be used to
-pass-through usb devices to the guest. HOSTUSBDEVICE syntax is:
+    type => 'string', format => $efidisk_fmt,
+    description => "Configure a Disk for storing EFI vars",
+};
 
-'bus-port(.port)*' (decimal numbers) or
-'vendor_id:product_id' (hexadeciaml numbers)
+PVE::JSONSchema::register_standard_option("pve-qm-efidisk", $efidisk_desc);
 
-You can use the 'lsusb -t' command to list existing usb devices.
+my $usb_fmt = {
+    host => {
+       default_key => 1,
+       type => 'string', format => 'pve-qm-usb-device',
+       format_description => 'HOSTUSBDEVICE|spice',
+        description => <<EODESCR,
+The Host USB device or port or the value 'spice'. HOSTUSBDEVICE syntax is:
 
-Note: This option allows direct access to host hardware. So it is no longer possible to migrate such machines - use with special care.
+ 'bus-port(.port)*' (decimal numbers) or
+ 'vendor_id:product_id' (hexadeciaml numbers) or
+ 'spice'
 
-The value 'spice' can be used to add a usb redirection devices for spice.
+You can use the 'lsusb -t' command to list existing usb devices.
 
-The 'usb3' option determines whether the device is a USB3 device or not (this does currently not work with spice redirection).
+NOTE: This option allows direct access to host hardware. So it is no longer possible to migrate such machines - use with special care.
 
+The value 'spice' can be used to add a usb redirection devices for spice.
 EODESCR
+    },
+    usb3 => {
+       optional => 1,
+       type => 'boolean',
+       description => "Specifies whether if given host option is a USB3 device or port (this does currently not work reliably with spice redirection and is then ignored).",
+        default => 0,
+    },
+};
+
+my $usbdesc = {
+    optional => 1,
+    type => 'string', format => $usb_fmt,
+    description => "Configure an USB device (n is 0 to 4).",
 };
 PVE::JSONSchema::register_standard_option("pve-qm-usb", $usbdesc);
 
-my $hostpcidesc = {
-        optional => 1,
-        type => 'string', format => 'pve-qm-hostpci',
-        typetext => "[host=]HOSTPCIDEVICE [,rombar=on|off] [,pcie=0|1] [,x-vga=on|off]",
-        description => <<EODESCR,
-Map host pci devices. HOSTPCIDEVICE syntax is:
+# NOTE: the match-groups of this regex are used in parse_hostpci
+my $PCIRE = qr/([a-f0-9]{2}:[a-f0-9]{2})(?:\.([a-f0-9]))?/;
+my $hostpci_fmt = {
+    host => {
+       default_key => 1,
+       type => 'string',
+       pattern => qr/$PCIRE(;$PCIRE)*/,
+       format_description => 'HOSTPCIID[;HOSTPCIID2...]',
+       description => <<EODESCR,
+Host PCI device pass through. The PCI ID of a host's PCI device or a list 
+of PCI virtual functions of the host. HOSTPCIID syntax is:
 
 'bus:dev.func' (hexadecimal numbers)
 
-You can us the 'lspci' command to list existing pci devices.
+You can us the 'lspci' command to list existing PCI devices.
+EODESCR
+    },
+    rombar => {
+       type => 'boolean',
+        description =>  "Specify whether or not the device's ROM will be visible in the guest's memory map.",
+       optional => 1,
+       default => 1,
+    },
+    romfile => {
+        type => 'string',
+        pattern => '[^,;]+',
+        format_description => 'string',
+        description => "Custom pci device rom filename (must be located in /usr/share/kvm/).",
+        optional => 1,
+    },
+    pcie => {
+       type => 'boolean',
+        description =>  "Choose the PCI-express bus (needs the 'q35' machine model).",
+       optional => 1,
+       default => 0,
+    },
+    'x-vga' => {
+       type => 'boolean',
+        description =>  "Enable vfio-vga device support.",
+       optional => 1,
+       default => 0,
+    },
+};
+PVE::JSONSchema::register_format('pve-qm-hostpci', $hostpci_fmt);
 
-The 'rombar' option determines whether or not the device's ROM will be visible in the guest's memory map (default is 'on').
+my $hostpcidesc = {
+        optional => 1,
+        type => 'string', format => 'pve-qm-hostpci',
+        description => "Map host PCI devices into guest.",
+       verbose_description =>  <<EODESCR,
+Map host PCI devices into guest.
 
-Note: This option allows direct access to host hardware. So it is no longer possible to migrate such machines - use with special care.
+NOTE: This option allows direct access to host hardware. So it is no longer 
+possible to migrate such machines - use with special care.
 
-Experimental: user reported problems with this option.
+CAUTION: Experimental! User reported problems with this option.
 EODESCR
 };
 PVE::JSONSchema::register_standard_option("pve-qm-hostpci", $hostpcidesc);
@@ -774,12 +1056,15 @@ my $serialdesc = {
        optional => 1,
        type => 'string',
        pattern => '(/dev/.+|socket)',
-       description =>  <<EODESCR,
-Create a serial device inside the VM (n is 0 to 3), and pass through a host serial device (i.e. /dev/ttyS0), or create a unix socket on the host side (use 'qm terminal' to open a terminal connection).
+       description =>  "Create a serial device inside the VM (n is 0 to 3)",
+       verbose_description =>  <<EODESCR,
+Create a serial device inside the VM (n is 0 to 3), and pass through a
+host serial device (i.e. /dev/ttyS0), or create a unix socket on the
+host side (use 'qm terminal' to open a terminal connection).
 
-Note: If you pass through a host serial device, it is no longer possible to migrate such machines - use with special care.
+NOTE: If you pass through a host serial device, it is no longer possible to migrate such machines - use with special care.
 
-Experimental: user reported problems with this option.
+CAUTION: Experimental! User reported problems with this option.
 EODESCR
 };
 
@@ -787,12 +1072,13 @@ my $paralleldesc= {
        optional => 1,
        type => 'string',
         pattern => '/dev/parport\d+|/dev/usb/lp\d+',
-       description =>  <<EODESCR,
+       description =>  "Map host parallel devices (n is 0 to 2).",
+       verbose_description =>  <<EODESCR,
 Map host parallel devices (n is 0 to 2).
 
-Note: This option allows direct access to host hardware. So it is no longer possible to migrate such machines - use with special care.
+NOTE: This option allows direct access to host hardware. So it is no longer possible to migrate such machines - use with special care.
 
-Experimental: user reported problems with this option.
+CAUTION: Experimental! User reported problems with this option.
 EODESCR
 };
 
@@ -828,6 +1114,9 @@ for (my $i = 0; $i < $MAX_VIRTIO_DISKS; $i++)  {
     $confdesc->{"virtio$i"} = $virtiodesc;
 }
 
+$drivename_hash->{efidisk0} = 1;
+$confdesc->{efidisk0} = $efidisk_desc;
+
 for (my $i = 0; $i < $MAX_USB_DEVICES; $i++)  {
     $confdesc->{"usb$i"} = $usbdesc;
 }
@@ -835,7 +1124,7 @@ for (my $i = 0; $i < $MAX_USB_DEVICES; $i++)  {
 my $unuseddesc = {
     optional => 1,
     type => 'string', format => 'pve-volume-id',
-    description => "Reference to unused volumes.",
+    description => "Reference to unused volumes. This is used internally, and should not be modified manually.",
 };
 
 for (my $i = 0; $i < $MAX_UNUSED_DISKS; $i++)  {
@@ -868,11 +1157,15 @@ sub kvm_user_version {
 
     $kvm_user_version = 'unknown';
 
-    my $tmp = `kvm -help 2>/dev/null`;
+    my $code = sub {
+       my $line = shift;
+       if ($line =~ m/^QEMU( PC)? emulator version (\d+\.\d+(\.\d+)?)(\.\d+)?[,\s]/) {
+           $kvm_user_version = $2;
+       }
+    };
 
-    if ($tmp =~ m/^QEMU( PC)? emulator version (\d+\.\d+(\.\d+)?)(\.\d+)?[,\s]/) {
-       $kvm_user_version = $2;
-    }
+    eval { run_command("kvm -version", outfunc => $code); };
+    warn $@ if $@;
 
     return $kvm_user_version;
 
@@ -880,15 +1173,16 @@ sub kvm_user_version {
 
 my $kernel_has_vhost_net = -c '/dev/vhost-net';
 
-sub disknames {
+sub valid_drive_names {
     # order is important - used to autoselect boot disk
     return ((map { "ide$_" } (0 .. ($MAX_IDE_DISKS - 1))),
             (map { "scsi$_" } (0 .. ($MAX_SCSI_DISKS - 1))),
             (map { "virtio$_" } (0 .. ($MAX_VIRTIO_DISKS - 1))),
-            (map { "sata$_" } (0 .. ($MAX_SATA_DISKS - 1))));
+            (map { "sata$_" } (0 .. ($MAX_SATA_DISKS - 1))),
+            'efidisk0');
 }
 
-sub valid_drivename {
+sub is_valid_drivename {
     my $dev = shift;
 
     return defined($drivename_hash->{$dev});
@@ -914,6 +1208,7 @@ sub os_list_description {
        wvista => 'Windows Vista',
        win7 => 'Windows 7',
        win8 => 'Windows 8/2012',
+       win10 => 'Windows 10/2016',
        l24 => 'Linux 2.4',
        l26 => 'Linux 2.6',
     };
@@ -1001,31 +1296,6 @@ sub cleanup_drive_path {
     $drive->{media} = 'cdrom' if !$drive->{media} && $drive->{file} =~ m/^(cdrom|none)$/;
 }
 
-sub create_conf_nolock {
-    my ($vmid, $settings) = @_;
-
-    my $filename = config_file($vmid);
-
-    die "configuration file '$filename' already exists\n" if -f $filename;
-
-    my $defaults = load_defaults();
-
-    $settings->{name} = "vm$vmid" if !$settings->{name};
-    $settings->{memory} = $defaults->{memory} if !$settings->{memory};
-
-    my $data = '';
-    foreach my $opt (keys %$settings) {
-       next if !$confdesc->{$opt};
-
-       my $value = $settings->{$opt};
-       next if !$value;
-
-       $data .= "$opt: $value\n";
-    }
-
-    PVE::Tools::file_set_contents($filename, $data);
-}
-
 sub parse_hotplug_features {
     my ($data) = @_;
 
@@ -1039,7 +1309,7 @@ sub parse_hotplug_features {
        if ($feature =~ m/^(network|disk|cpu|memory|usb)$/) {
            $res->{$1} = 1;
        } else {
-           warn "ignoring unknown hotplug feature '$feature'\n";
+           die "invalid hotplug feature '$feature'\n";
        }
     }
     return $res;
@@ -1096,6 +1366,28 @@ sub parse_drive {
            $res->{"m$opt"} = sprintf("%.3f", $bps / (1024*1024.0));
        }
     }
+
+    # can't use the schema's 'requires' because of the mbps* => bps* "transforming aliases"
+    for my $requirement (
+       [mbps_max => 'mbps'],
+       [mbps_rd_max => 'mbps_rd'],
+       [mbps_wr_max => 'mbps_wr'],
+       [miops_max => 'miops'],
+       [miops_rd_max => 'miops_rd'],
+       [miops_wr_max => 'miops_wr'],
+       [bps_max_length => 'mbps_max'],
+       [bps_rd_max_length => 'mbps_rd_max'],
+       [bps_wr_max_length => 'mbps_wr_max'],
+       [iops_max_length => 'iops_max'],
+       [iops_rd_max_length => 'iops_rd_max'],
+       [iops_wr_max_length => 'iops_wr_max']) {
+       my ($option, $requires) = @$requirement;
+       if ($res->{$option} && !$res->{$requires}) {
+           warn "$option requires $requires\n";
+           ++$error;
+       }
+    }
+
     return undef if $error;
 
     return undef if $res->{mbps_rd} && $res->{mbps};
@@ -1216,34 +1508,33 @@ sub print_drivedevice_full {
        my ($maxdev, $controller, $controller_prefix) = scsihw_infos($conf, $drive);
        my $unit = $drive->{index} % $maxdev;
        my $devicetype = 'hd';
-        my $path = '';
-        if (drive_is_cdrom($drive)) {
-              $devicetype = 'cd';
+       my $path = '';
+       if (drive_is_cdrom($drive)) {
+           $devicetype = 'cd';
        } else {
-              if ($drive->{file} =~ m|^/|) {
-                  $path = $drive->{file};
-              } else {
-                  $path = PVE::Storage::path($storecfg, $drive->{file});
-              }
-
-             if($path =~ m/^iscsi\:\/\//){
-                 $devicetype = 'generic';
-             } else {
-                 if (my $info = path_is_scsi($path)) {
-                     if ($info->{type} == 0) {
-                         $devicetype = 'block';
-                     } elsif ($info->{type} == 1) { # tape
-                         $devicetype = 'generic';
-                     }
-                 }
-             }
-         }
+           if ($drive->{file} =~ m|^/|) {
+               $path = $drive->{file};
+               if (my $info = path_is_scsi($path)) {
+                   if ($info->{type} == 0 && $drive->{scsiblock}) {
+                       $devicetype = 'block';
+                   } elsif ($info->{type} == 1) { # tape
+                       $devicetype = 'generic';
+                   }
+               }
+           } else {
+                $path = PVE::Storage::path($storecfg, $drive->{file});
+           }
 
-        if (!$conf->{scsihw} || ($conf->{scsihw} =~ m/^lsi/)){
-            $device = "scsi-$devicetype,bus=$controller_prefix$controller.0,scsi-id=$unit,drive=drive-$drive->{interface}$drive->{index},id=$drive->{interface}$drive->{index}";
-        } else {
-            $device = "scsi-$devicetype,bus=$controller_prefix$controller.0,channel=0,scsi-id=0,lun=$drive->{index},drive=drive-$drive->{interface}$drive->{index},id=$drive->{interface}$drive->{index}";
-        }
+           if($path =~ m/^iscsi\:\/\//){
+               $devicetype = 'generic';
+           }
+       }
+
+       if (!$conf->{scsihw} || ($conf->{scsihw} =~ m/^lsi/)){
+           $device = "scsi-$devicetype,bus=$controller_prefix$controller.0,scsi-id=$unit,drive=drive-$drive->{interface}$drive->{index},id=$drive->{interface}$drive->{index}";
+       } else {
+           $device = "scsi-$devicetype,bus=$controller_prefix$controller.0,channel=0,scsi-id=0,lun=$drive->{index},drive=drive-$drive->{interface}$drive->{index},id=$drive->{interface}$drive->{index}";
+       }
 
     } elsif ($drive->{interface} eq 'ide'){
        $maxdev = 2;
@@ -1253,6 +1544,7 @@ sub print_drivedevice_full {
 
        $device = "ide-$devicetype,bus=ide.$controller,unit=$unit,drive=drive-$drive->{interface}$drive->{index},id=$drive->{interface}$drive->{index}";
        if ($devicetype eq 'hd' && (my $model = $drive->{model})) {
+           $model = URI::Escape::uri_unescape($model);
            $device .= ",model=$model";
        }
     } elsif ($drive->{interface} eq 'sata'){
@@ -1285,7 +1577,6 @@ sub get_initiator_name {
     return $initiator;
 }
 
-my @qemu_drive_options = qw(heads secs cyls trans media format cache snapshot rerror werror aio discard iops iops_rd iops_wr iops_max iops_rd_max iops_wr_max serial);
 sub print_drive_full {
     my ($storecfg, $vmid, $drive) = @_;
 
@@ -1308,18 +1599,39 @@ sub print_drive_full {
    }
 
     my $opts = '';
+    my @qemu_drive_options = qw(heads secs cyls trans media format cache snapshot rerror werror aio discard);
     foreach my $o (@qemu_drive_options) {
-       next if $o eq 'bootindex';
        $opts .= ",$o=$drive->{$o}" if $drive->{$o};
     }
+    foreach my $type (['', '-total'], [_rd => '-read'], [_wr => '-write']) {
+       my ($dir, $qmpname) = @$type;
+       if (my $v = $drive->{"mbps$dir"}) {
+           $opts .= ",throttling.bps$qmpname=".int($v*1024*1024);
+       }
+       if (my $v = $drive->{"mbps${dir}_max"}) {
+           $opts .= ",throttling.bps$qmpname-max=".int($v*1024*1024);
+       }
+       if (my $v = $drive->{"bps${dir}_max_length"}) {
+           $opts .= ",throttling.bps$qmpname-max-length=$v";
+       }
+       if (my $v = $drive->{"iops${dir}"}) {
+           $opts .= ",throttling.iops$qmpname=$v";
+       }
+       if (my $v = $drive->{"iops${dir}_max"}) {
+           $opts .= ",throttling.iops$qmpname-max=$v";
+       }
+       if (my $v = $drive->{"iops${dir}_max_length"}) {
+           $opts .= ",throttling.iops$qmpname-max-length=$v";
+       }
+    }
 
-    $opts .= ",format=$format" if $format && !$drive->{format};
-
-    foreach my $o (qw(bps bps_rd bps_wr)) {
-       my $v = $drive->{"m$o"};
-       $opts .= ",$o=" . int($v*1024*1024) if $v;
+    if (my $serial = $drive->{serial}) {
+       $serial = URI::Escape::uri_unescape($serial);
+       $opts .= ",serial=$serial";
     }
 
+    $opts .= ",format=$format" if $format && !$drive->{format};
+
     my $cache_direct = 0;
 
     if (my $cache = $drive->{cache}) {
@@ -1429,6 +1741,26 @@ sub print_netdev_full {
     return $netdev;
 }
 
+
+sub print_cpu_device {
+    my ($conf, $id) = @_;
+
+    my $kvm = $conf->{kvm} // 1;
+    my $cpu = $kvm ? "kvm64" : "qemu64";
+    if (my $cputype = $conf->{cpu}) {
+       my $cpuconf = PVE::JSONSchema::parse_property_string($cpu_fmt, $cputype)
+           or die "Cannot parse cpu description: $cputype\n";
+       $cpu = $cpuconf->{cputype};
+    }
+
+    my $cores = $conf->{cores} || 1;
+
+    my $current_core = ($id - 1) % $cores;
+    my $current_socket = int(($id - 1 - $current_core)/$cores);
+
+    return "$cpu-x86_64-cpu,id=cpu$id,socket-id=$current_socket,core-id=$current_core,thread-id=0";
+}
+
 sub drive_is_cdrom {
     my ($drive) = @_;
 
@@ -1436,28 +1768,26 @@ sub drive_is_cdrom {
 
 }
 
-sub parse_numa {
-    my ($data) = @_;
-
-    my $res = {};
-
-    foreach my $kvp (split(/,/, $data)) {
-
-       if ($kvp =~ m/^memory=(\S+)$/) {
-           $res->{memory} = $1;
-       } elsif ($kvp =~ m/^policy=(preferred|bind|interleave)$/) {
-           $res->{policy} = $1;
-       } elsif ($kvp =~ m/^cpus=(\d+)(-(\d+))?$/) {
-           $res->{cpus}->{start} = $1;
-           $res->{cpus}->{end} = $3;
-       } elsif ($kvp =~ m/^hostnodes=(\d+)(-(\d+))?$/) {
-           $res->{hostnodes}->{start} = $1;
-           $res->{hostnodes}->{end} = $3;
+sub parse_number_sets {
+    my ($set) = @_;
+    my $res = [];
+    foreach my $part (split(/;/, $set)) {
+       if ($part =~ /^\s*(\d+)(?:-(\d+))?\s*$/) {
+           die "invalid range: $part ($2 < $1)\n" if defined($2) && $2 < $1;
+           push @$res, [ $1, $2 ];
        } else {
-           return undef;
+           die "invalid range: $part\n";
        }
     }
+    return $res;
+}
 
+sub parse_numa {
+    my ($data) = @_;
+
+    my $res = PVE::JSONSchema::parse_property_string($numa_fmt, $data);
+    $res->{cpus} = parse_number_sets($res->{cpus}) if defined($res->{cpus});
+    $res->{hostnodes} = parse_number_sets($res->{hostnodes}) if defined($res->{hostnodes});
     return $res;
 }
 
@@ -1466,35 +1796,23 @@ sub parse_hostpci {
 
     return undef if !$value;
 
+    my $res = PVE::JSONSchema::parse_property_string($hostpci_fmt, $value);
 
-    my @list = split(/,/, $value);
-    my $found;
-
-    my $res = {};
-    foreach my $kv (@list) {
-
-       if ($kv =~ m/^(host=)?([a-f0-9]{2}:[a-f0-9]{2})(\.([a-f0-9]))?$/) {
-           $found = 1;
-           if(defined($4)){
-               push @{$res->{pciid}}, { id => $2 , function => $4};
-
-           }else{
-               my $pcidevices = lspci($2);
-               $res->{pciid} = $pcidevices->{$2};
+    my @idlist = split(/;/, $res->{host});
+    delete $res->{host};
+    foreach my $id (@idlist) {
+       if ($id =~ /^$PCIRE$/) {
+           if (defined($2)) {
+               push @{$res->{pciid}}, { id => $1, function => $2 };
+           } else {
+               my $pcidevices = lspci($1);
+               $res->{pciid} = $pcidevices->{$1};
            }
-       } elsif ($kv =~ m/^rombar=(on|off)$/) {
-           $res->{rombar} = $1;
-       } elsif ($kv =~ m/^x-vga=(on|off)$/) {
-           $res->{'x-vga'} = $1;
-       } elsif ($kv =~ m/^pcie=(\d+)$/) {
-           $res->{pcie} = 1 if $1 == 1;
        } else {
-           warn "unknown hostpci setting '$kv'\n";
+           # should have been caught by parse_property_string already
+           die "failed to parse PCI id: $id\n";
        }
     }
-
-    return undef if !$found;
-
     return $res;
 }
 
@@ -1502,54 +1820,22 @@ sub parse_hostpci {
 sub parse_net {
     my ($data) = @_;
 
-    my $res = {};
-
-    foreach my $kvp (split(/,/, $data)) {
-
-       if ($kvp =~ m/^(ne2k_pci|e1000|e1000-82540em|e1000-82544gc|e1000-82545em|rtl8139|pcnet|virtio|ne2k_isa|i82551|i82557b|i82559er|vmxnet3)(=([0-9a-f]{2}(:[0-9a-f]{2}){5}))?$/i) {
-           my $model = lc($1);
-           my $mac = defined($3) ? uc($3) : PVE::Tools::random_ether_addr();
-           $res->{model} = $model;
-           $res->{macaddr} = $mac;
-       } elsif ($kvp =~ m/^bridge=(\S+)$/) {
-           $res->{bridge} = $1;
-       } elsif ($kvp =~ m/^queues=(\d+)$/) {
-           $res->{queues} = $1;
-       } elsif ($kvp =~ m/^rate=(\d+(\.\d+)?)$/) {
-           $res->{rate} = $1;
-        } elsif ($kvp =~ m/^tag=(\d+)$/) {
-            $res->{tag} = $1;
-        } elsif ($kvp =~ m/^trunks=([0-9;]+)$/) {
-           $res->{trunks} = $1;
-        } elsif ($kvp =~ m/^firewall=([01])$/) {
-           $res->{firewall} = $1;
-       } elsif ($kvp =~ m/^link_down=([01])$/) {
-           $res->{link_down} = $1;
-       } else {
-           return undef;
-       }
-
+    my $res = eval { PVE::JSONSchema::parse_property_string($net_fmt, $data) };
+    if ($@) {
+       warn $@;
+       return undef;
+    }
+    if (!defined($res->{macaddr})) {
+       my $dc = PVE::Cluster::cfs_read_file('datacenter.cfg');
+       $res->{macaddr} = PVE::Tools::random_ether_addr($dc->{mac_prefix});
     }
-
-    return undef if !$res->{model};
-
     return $res;
 }
 
 sub print_net {
     my $net = shift;
 
-    my $res = "$net->{model}";
-    $res .= "=$net->{macaddr}" if $net->{macaddr};
-    $res .= ",bridge=$net->{bridge}" if $net->{bridge};
-    $res .= ",rate=$net->{rate}" if $net->{rate};
-    $res .= ",tag=$net->{tag}" if $net->{tag};
-    $res .= ",trunks=$net->{trunks}" if $net->{trunks};
-    $res .= ",firewall=1" if $net->{firewall};
-    $res .= ",link_down=1" if $net->{link_down};
-    $res .= ",queues=$net->{queues}" if $net->{queues};
-
-    return $res;
+    return PVE::JSONSchema::print_property_string($net, $net_fmt);
 }
 
 sub add_random_macs {
@@ -1563,26 +1849,6 @@ sub add_random_macs {
     }
 }
 
-sub add_unused_volume {
-    my ($config, $volid) = @_;
-
-    my $key;
-    for (my $ind = $MAX_UNUSED_DISKS - 1; $ind >= 0; $ind--) {
-       my $test = "unused$ind";
-       if (my $vid = $config->{$test}) {
-           return if $vid eq $volid; # do not add duplicates
-       } else {
-           $key = $test;
-       }
-    }
-
-    die "To many unused volume - please delete them first.\n" if !$key;
-
-    $config->{$key} = $volid;
-
-    return $key;
-}
-
 sub vm_is_volid_owner {
     my ($storecfg, $vmid, $volid) = @_;
 
@@ -1637,7 +1903,7 @@ sub vmconfig_register_unused_drive {
     if (!drive_is_cdrom($drive)) {
        my $volid = $drive->{file};
        if (vm_is_volid_owner($storecfg, $vmid, $volid)) {
-           add_unused_volume($conf, $volid, $vmid);
+           PVE::QemuConfig->add_unused_volume($conf, $volid, $vmid);
        }
     }
 }
@@ -1674,47 +1940,54 @@ sub vmconfig_cleanup_pending {
 }
 
 # smbios: [manufacturer=str][,product=str][,version=str][,serial=str][,uuid=uuid][,sku=str][,family=str]
-my $smbios1_desc = {
+my $smbios1_fmt = {
     uuid => {
        type => 'string',
        pattern => '[a-fA-F0-9]{8}(?:-[a-fA-F0-9]{4}){3}-[a-fA-F0-9]{12}',
        format_description => 'UUID',
+        description => "Set SMBIOS1 UUID.",
        optional => 1,
     },
     version => {
        type => 'string',
        pattern => '\S+',
-       format_description => 'str',
+       format_description => 'string',
+        description => "Set SMBIOS1 version.",
        optional => 1,
     },
     serial => {
        type => 'string',
        pattern => '\S+',
-       format_description => 'str',
+       format_description => 'string',
+        description => "Set SMBIOS1 serial number.",
        optional => 1,
     },
     manufacturer => {
        type => 'string',
        pattern => '\S+',
-       format_description => 'name',
+       format_description => 'string',
+        description => "Set SMBIOS1 manufacturer.",
        optional => 1,
     },
     product => {
        type => 'string',
        pattern => '\S+',
-       format_description => 'name',
+       format_description => 'string',
+        description => "Set SMBIOS1 product ID.",
        optional => 1,
     },
     sku => {
        type => 'string',
        pattern => '\S+',
-       format_description => 'str',
+       format_description => 'string',
+        description => "Set SMBIOS1 SKU string.",
        optional => 1,
     },
     family => {
        type => 'string',
        pattern => '\S+',
-       format_description => 'str',
+       format_description => 'string',
+        description => "Set SMBIOS1 family string.",
        optional => 1,
     },
 };
@@ -1722,124 +1995,36 @@ my $smbios1_desc = {
 sub parse_smbios1 {
     my ($data) = @_;
 
-    my $res = eval { PVE::JSONSchema::parse_property_string($smbios1_desc, $data) };
+    my $res = eval { PVE::JSONSchema::parse_property_string($smbios1_fmt, $data) };
     warn $@ if $@;
     return $res;
 }
 
 sub print_smbios1 {
     my ($smbios1) = @_;
-    return PVE::JSONSchema::print_property_string($smbios1, $smbios1_desc);
+    return PVE::JSONSchema::print_property_string($smbios1, $smbios1_fmt);
 }
 
-PVE::JSONSchema::register_format('pve-qm-smbios1', $smbios1_desc);
+PVE::JSONSchema::register_format('pve-qm-smbios1', $smbios1_fmt);
 
 PVE::JSONSchema::register_format('pve-qm-bootdisk', \&verify_bootdisk);
 sub verify_bootdisk {
     my ($value, $noerr) = @_;
 
-    return $value if valid_drivename($value);
+    return $value if is_valid_drivename($value);
 
     return undef if $noerr;
 
     die "invalid boot disk '$value'\n";
 }
 
-PVE::JSONSchema::register_format('pve-qm-numanode', \&verify_numa);
-sub verify_numa {
-    my ($value, $noerr) = @_;
-
-    return $value if parse_numa($value);
-
-    return undef if $noerr;
-
-    die "unable to parse numa options\n";
-}
-
-PVE::JSONSchema::register_format('pve-qm-net', \&verify_net);
-sub verify_net {
-    my ($value, $noerr) = @_;
-
-    return $value if parse_net($value);
-
-    return undef if $noerr;
-
-    die "unable to parse network options\n";
-}
-
-PVE::JSONSchema::register_format('pve-qm-hostpci', \&verify_hostpci);
-sub verify_hostpci {
-    my ($value, $noerr) = @_;
-
-    return $value if parse_hostpci($value);
-
-    return undef if $noerr;
-
-    die "unable to parse pci id\n";
-}
-
-PVE::JSONSchema::register_format('pve-qm-watchdog', \&verify_watchdog);
-sub verify_watchdog {
-    my ($value, $noerr) = @_;
-
-    return $value if parse_watchdog($value);
-
-    return undef if $noerr;
-
-    die "unable to parse watchdog options\n";
-}
-
 sub parse_watchdog {
     my ($value) = @_;
 
     return undef if !$value;
 
-    my $res = {};
-
-    foreach my $p (split(/,/, $value)) {
-       next if $p =~ m/^\s*$/;
-
-       if ($p =~ m/^(model=)?(i6300esb|ib700)$/) {
-           $res->{model} = $2;
-       } elsif ($p =~ m/^(action=)?(reset|shutdown|poweroff|pause|debug|none)$/) {
-           $res->{action} = $2;
-       } else {
-           return undef;
-       }
-    }
-
-    return $res;
-}
-
-sub parse_usb_device {
-    my ($value) = @_;
-
-    return undef if !$value;
-
-    my @dl = split(/,/, $value);
-    my $found;
-
-    my $res = {};
-    foreach my $v (@dl) {
-       if ($v =~ m/^host=(0x)?([0-9A-Fa-f]{4}):(0x)?([0-9A-Fa-f]{4})$/) {
-           $found = 1;
-           $res->{vendorid} = $2;
-           $res->{productid} = $4;
-       } elsif ($v =~ m/^host=(\d+)\-(\d+(\.\d+)*)$/) {
-           $found = 1;
-           $res->{hostbus} = $1;
-           $res->{hostport} = $2;
-       } elsif ($v =~ m/^spice$/) {
-           $found = 1;
-           $res->{spice} = 1;
-       } elsif ($v =~ m/^usb3=yes$/) {
-           $res->{usb3} = 1;
-       } else {
-           return undef;
-       }
-    }
-    return undef if !$found;
-
+    my $res = eval { PVE::JSONSchema::parse_property_string($watchdog_fmt, $value) };
+    warn $@ if $@;
     return $res;
 }
 
@@ -1893,12 +2078,6 @@ sub check_type {
         die "type check ('number') failed - got '$value'\n";
     } elsif ($type eq 'string') {
        if (my $fmt = $confdesc->{$key}->{format}) {
-           if ($fmt eq 'pve-qm-drive') {
-               # special case - we need to pass $key to parse_drive()
-               my $drive = parse_drive($key, $value);
-               return $value if $drive;
-               die "unable to parse drive options\n";
-           }
            PVE::JSONSchema::check_format($fmt, $value);
            return $value;
        }
@@ -1909,43 +2088,6 @@ sub check_type {
     }
 }
 
-sub lock_config_full {
-    my ($vmid, $timeout, $code, @param) = @_;
-
-    my $filename = config_file_lock($vmid);
-
-    my $res = lock_file($filename, $timeout, $code, @param);
-
-    die $@ if $@;
-
-    return $res;
-}
-
-sub lock_config_mode {
-    my ($vmid, $timeout, $shared, $code, @param) = @_;
-
-    my $filename = config_file_lock($vmid);
-
-    my $res = lock_file_full($filename, $timeout, $shared, $code, @param);
-
-    die $@ if $@;
-
-    return $res;
-}
-
-sub lock_config {
-    my ($vmid, $code, @param) = @_;
-
-    return lock_config_full($vmid, 10, $code, @param);
-}
-
-sub cfs_config_path {
-    my ($vmid, $node) = @_;
-
-    $node = $nodename if !$node;
-    return "nodes/$node/qemu-server/$vmid.conf";
-}
-
 sub check_iommu_support{
     #fixme : need to check IOMMU support
     #http://www.linux-kvm.org/page/How_to_assign_devices_with_VT-d_in_KVM
@@ -1955,34 +2097,38 @@ sub check_iommu_support{
 
 }
 
-sub config_file {
-    my ($vmid, $node) = @_;
-
-    my $cfspath = cfs_config_path($vmid, $node);
-    return "/etc/pve/$cfspath";
-}
-
-sub config_file_lock {
-    my ($vmid) = @_;
-
-    return "$lock_dir/lock-$vmid.conf";
-}
-
 sub touch_config {
     my ($vmid) = @_;
 
-    my $conf = config_file($vmid);
+    my $conf = PVE::QemuConfig->config_file($vmid);
     utime undef, undef, $conf;
 }
 
 sub destroy_vm {
     my ($storecfg, $vmid, $keep_empty_config, $skiplock) = @_;
 
-    my $conffile = config_file($vmid);
+    my $conffile = PVE::QemuConfig->config_file($vmid);
+
+    my $conf = PVE::QemuConfig->load_config($vmid);
+
+    PVE::QemuConfig->check_lock($conf) if !$skiplock;
+
+    if ($conf->{template}) {
+       # check if any base image is still used by a linked clone
+       foreach_drive($conf, sub {
+               my ($ds, $drive) = @_;
+
+               return if drive_is_cdrom($drive);
+
+               my $volid = $drive->{file};
+
+               return if !$volid || $volid =~ m|^/|;
 
-    my $conf = load_config($vmid);
+               die "base volume '$volid' is still in use by linked cloned\n"
+                   if PVE::Storage::volume_is_base_and_used($storecfg, $volid);
 
-    check_lock($conf) if !$skiplock;
+       });
+    }
 
     # only remove disks owned by this VM
     foreach_drive($conf, sub {
@@ -1997,7 +2143,11 @@ sub destroy_vm {
        my ($path, $owner) = PVE::Storage::path($storecfg, $volid);
        return if !$path || !$owner || ($owner != $vmid);
 
-       PVE::Storage::vdisk_free($storecfg, $volid);
+       eval {
+           PVE::Storage::vdisk_free($storecfg, $volid);
+       };
+       warn "Could not remove disk '$volid', check manually: $@" if $@;
+
     });
 
     if ($keep_empty_config) {
@@ -2022,18 +2172,6 @@ sub destroy_vm {
     warn $@ if $@;
 }
 
-sub load_config {
-    my ($vmid, $node) = @_;
-
-    my $cfspath = cfs_config_path($vmid, $node);
-
-    my $conf = PVE::Cluster::cfs_read_file($cfspath);
-
-    die "no such VM ('$vmid')\n" if !defined($conf);
-
-    return $conf;
-}
-
 sub parse_vm_config {
     my ($filename, $raw) = @_;
 
@@ -2108,8 +2246,9 @@ sub parse_vm_config {
            if ($@) {
                warn "vm $vmid - unable to parse value of '$key' - $@";
            } else {
+               $key = 'ide2' if $key eq 'cdrom';
                my $fmt = $confdesc->{$key}->{format};
-               if ($fmt && $fmt eq 'pve-qm-drive') {
+               if ($fmt && $fmt =~ /^pve-qm-(?:ide|scsi|virtio|sata)$/) {
                    my $v = parse_drive($key, $value);
                    if (my $volid = filename_to_volume_id($vmid, $v->{file}, $v->{media})) {
                        $v->{file} = $volid;
@@ -2120,11 +2259,7 @@ sub parse_vm_config {
                    }
                }
 
-               if ($key eq 'cdrom') {
-                   $conf->{ide2} = $value;
-               } else {
-                   $conf->{$key} = $value;
-               }
+               $conf->{$key} = $value;
            }
        }
     }
@@ -2178,7 +2313,7 @@ sub write_vm_config {
 
            $cref->{$key} = $value;
 
-           if (!$snapname && valid_drivename($key)) {
+           if (!$snapname && is_valid_drivename($key)) {
                my $drive = parse_drive($key, $value);
                $used_volids->{$drive->{file}} = 1 if $drive && $drive->{file};
            }
@@ -2240,22 +2375,6 @@ sub write_vm_config {
     return $raw;
 }
 
-sub update_config_nolock {
-    my ($vmid, $conf, $skiplock) = @_;
-
-    check_lock($conf) if !$skiplock;
-
-    my $cfspath = cfs_config_path($vmid);
-
-    PVE::Cluster::cfs_write_file($cfspath, $conf);
-}
-
-sub update_config {
-    my ($vmid, $conf, $skiplock) = @_;
-
-    lock_config($vmid, &update_config_nolock, $conf, $skiplock);
-}
-
 sub load_defaults {
 
     my $res = {};
@@ -2362,12 +2481,6 @@ sub shared_nodes {
     return $nodehash
 }
 
-sub check_lock {
-    my ($conf) = @_;
-
-    die "VM is locked ($conf->{lock})\n" if $conf->{lock};
-}
-
 sub check_cmdline {
     my ($pidfile, $pid) = @_;
 
@@ -2397,7 +2510,7 @@ sub check_cmdline {
 sub check_running {
     my ($vmid, $nocheck, $node) = @_;
 
-    my $filename = config_file($vmid, $node);
+    my $filename = PVE::QemuConfig->config_file($vmid, $node);
 
     die "unable to find configuration file for VM $vmid - no such machine\n"
        if !$nocheck && ! -f $filename;
@@ -2450,7 +2563,7 @@ sub disksize {
 
     my $bootdisk = $conf->{bootdisk};
     return undef if !$bootdisk;
-    return undef if !valid_drivename($bootdisk);
+    return undef if !is_valid_drivename($bootdisk);
 
     return undef if !$conf->{$bootdisk};
 
@@ -2478,6 +2591,8 @@ sub vmstatus {
     my $storecfg = PVE::Storage::config();
 
     my $list = vzlist();
+    my $defaults = load_defaults();
+
     my ($uptime) = PVE::ProcFSTools::read_proc_uptime(1);
 
     my $cpucount = $cpuinfo->{cpus} || 1;
@@ -2485,7 +2600,7 @@ sub vmstatus {
     foreach my $vmid (keys %$list) {
        next if $opt_vmid && ($vmid ne $opt_vmid);
 
-       my $cfspath = cfs_config_path($vmid);
+       my $cfspath = PVE::QemuConfig->cfs_config_path($vmid);
        my $conf = PVE::Cluster::cfs_read_file($cfspath) || {};
 
        my $d = {};
@@ -2503,16 +2618,19 @@ sub vmstatus {
            $d->{maxdisk} = 0;
        }
 
-       $d->{cpus} = ($conf->{sockets} || 1) * ($conf->{cores} || 1);
+       $d->{cpus} = ($conf->{sockets} || $defaults->{sockets})
+           * ($conf->{cores} || $defaults->{cores});
        $d->{cpus} = $cpucount if $d->{cpus} > $cpucount;
        $d->{cpus} = $conf->{vcpus} if $conf->{vcpus};
 
        $d->{name} = $conf->{name} || "VM $vmid";
-       $d->{maxmem} = $conf->{memory} ? $conf->{memory}*(1024*1024) : 0;
+       $d->{maxmem} = $conf->{memory} ? $conf->{memory}*(1024*1024)
+           : $defaults->{memory}*(1024*1024);
 
        if ($conf->{balloon}) {
            $d->{balloon_min} = $conf->{balloon}*(1024*1024);
-           $d->{shares} = defined($conf->{shares}) ? $conf->{shares} : 1000;
+           $d->{shares} = defined($conf->{shares}) ? $conf->{shares}
+               : $defaults->{shares};
        }
 
        $d->{uptime} = 0;
@@ -2525,7 +2643,7 @@ sub vmstatus {
        $d->{diskread} = 0;
        $d->{diskwrite} = 0;
 
-        $d->{template} = is_template($conf);
+        $d->{template} = PVE::QemuConfig->is_template($conf);
 
        $res->{$vmid} = $d;
     }
@@ -2656,7 +2774,7 @@ sub vmstatus {
        $qmpclient->queue_cmd($vmid, $statuscb, 'query-status');
     }
 
-    $qmpclient->queue_execute(undef, 1);
+    $qmpclient->queue_execute(undef, 2);
 
     foreach my $vmid (keys %$list) {
        next if $opt_vmid && ($vmid ne $opt_vmid);
@@ -2666,90 +2784,58 @@ sub vmstatus {
     return $res;
 }
 
-sub foreach_dimm {
-    my ($conf, $vmid, $memory, $sockets, $func) = @_;
-
-    my $dimm_id = 0;
-    my $current_size = 1024;
-    my $dimm_size = 512;
-    return if $current_size == $memory;
-
-    for (my $j = 0; $j < 8; $j++) {
-       for (my $i = 0; $i < 32; $i++) {
-           my $name = "dimm${dimm_id}";
-           $dimm_id++;
-           my $numanode = $i % $sockets;
-           $current_size += $dimm_size;
-           &$func($conf, $vmid, $name, $dimm_size, $numanode, $current_size, $memory);
-           return  $current_size if $current_size >= $memory;
-       }
-       $dimm_size *= 2;
-    }
-}
-
-sub foreach_reverse_dimm {
-    my ($conf, $vmid, $memory, $sockets, $func) = @_;
-
-    my $dimm_id = 253;
-    my $current_size = 4177920;
-    my $dimm_size = 65536;
-    return if $current_size == $memory;
-
-    for (my $j = 0; $j < 8; $j++) {
-       for (my $i = 0; $i < 32; $i++) {
-           my $name = "dimm${dimm_id}";
-           $dimm_id--;
-           my $numanode = $i % $sockets;
-           $current_size -= $dimm_size;
-           &$func($conf, $vmid, $name, $dimm_size, $numanode, $current_size, $memory);
-           return  $current_size if $current_size <= $memory;
-       }
-       $dimm_size /= 2;
-    }
-}
-
 sub foreach_drive {
-    my ($conf, $func) = @_;
+    my ($conf, $func, @param) = @_;
 
-    foreach my $ds (keys %$conf) {
-       next if !valid_drivename($ds);
+    foreach my $ds (valid_drive_names()) {
+       next if !defined($conf->{$ds});
 
        my $drive = parse_drive($ds, $conf->{$ds});
        next if !$drive;
 
-       &$func($ds, $drive);
+       &$func($ds, $drive, @param);
     }
 }
 
 sub foreach_volid {
-    my ($conf, $func) = @_;
+    my ($conf, $func, @param) = @_;
 
     my $volhash = {};
 
     my $test_volid = sub {
-       my ($volid, $is_cdrom) = @_;
+       my ($volid, $is_cdrom, $replicate, $snapname) = @_;
 
        return if !$volid;
 
-       $volhash->{$volid} = $is_cdrom || 0;
+       $volhash->{$volid}->{cdrom} //= 1;
+       $volhash->{$volid}->{cdrom} = 0 if !$is_cdrom;
+
+       $volhash->{$volid}->{replicate} //= 0;
+       $volhash->{$volid}->{replicate} = 1 if $replicate;
+
+       $volhash->{$volid}->{referenced_in_config} //= 0;
+       $volhash->{$volid}->{referenced_in_config} = 1 if !defined($snapname);
+
+       $volhash->{$volid}->{referenced_in_snapshot}->{$snapname} = 1
+           if defined($snapname);
     };
 
     foreach_drive($conf, sub {
        my ($ds, $drive) = @_;
-       &$test_volid($drive->{file}, drive_is_cdrom($drive));
+       $test_volid->($drive->{file}, drive_is_cdrom($drive), $drive->{replicate} // 1, undef);
     });
 
     foreach my $snapname (keys %{$conf->{snapshots}}) {
        my $snap = $conf->{snapshots}->{$snapname};
-       &$test_volid($snap->{vmstate}, 0);
+       $test_volid->($snap->{vmstate}, 0, 1, $snapname);
        foreach_drive($snap, sub {
            my ($ds, $drive) = @_;
-           &$test_volid($drive->{file}, drive_is_cdrom($drive));
+           $test_volid->($drive->{file}, drive_is_cdrom($drive), $drive->{replicate} // 1, $snapname);
         });
     }
 
     foreach my $volid (keys %$volhash) {
-       &$func($volid, $volhash->{$volid});
+       &$func($volid, $volhash->{$volid}, @param);
     }
 }
 
@@ -2774,6 +2860,12 @@ sub config_to_command {
     my $bridges = {};
     my $kvmver = kvm_user_version();
     my $vernum = 0; # unknown
+    my $ostype = $conf->{ostype};
+    my $winversion = windows_version($ostype);
+    my $kvm = $conf->{kvm} // 1;
+
+    die "KVM virtualisation configured, but not available. Either disable in VM configuration or enable in BIOS.\n" if (!$cpuinfo->{hvm} && $kvm);
+
     if ($kvmver =~ m/^(\d+)\.(\d+)$/) {
        $vernum = $1*1000000+$2*1000;
     } elsif ($kvmver =~ m/^(\d+)\.(\d+)\.(\d+)$/) {
@@ -2793,19 +2885,6 @@ sub config_to_command {
     my $cpuunits = defined($conf->{cpuunits}) ?
             $conf->{cpuunits} : $defaults->{cpuunits};
 
-    push @$cmd, '/usr/bin/systemd-run';
-    push @$cmd, '--scope';
-    push @$cmd, '--slice', "qemu";
-    push @$cmd, '--unit', $vmid;
-    # set KillMode=none, so that systemd don't kill those scopes
-    # at shutdown (pve-manager service should stop the VMs instead)
-    push @$cmd, '-p', "KillMode=none";
-    push @$cmd, '-p', "CPUShares=$cpuunits";
-    if ($conf->{cpulimit}) {
-       my $cpulimit = int($conf->{cpulimit} * 100);
-       push @$cmd, '-p', "CPUQuota=$cpulimit\%";
-    }
-
     push @$cmd, '/usr/bin/kvm';
 
     push @$cmd, '-id', $vmid;
@@ -2816,8 +2895,6 @@ sub config_to_command {
     push @$cmd, '-chardev', "socket,id=qmp,path=$qmpsocket,server,nowait";
     push @$cmd, '-mon', "chardev=qmp,mode=control";
 
-    my $socket = vnc_socket($vmid);
-    push @$cmd,  '-vnc', "unix:$socket,x509,password";
 
     push @$cmd, '-pidfile' , pidfile_name($vmid);
 
@@ -2828,58 +2905,43 @@ sub config_to_command {
     }
 
     if ($conf->{bios} && $conf->{bios} eq 'ovmf') {
-       my $ovmfvar = "OVMF_VARS-pure-efi.fd";
-       my $ovmfvar_src = "/usr/share/kvm/$ovmfvar";
-       my $ovmfvar_dst = "/tmp/$vmid-$ovmfvar";
-       PVE::Tools::file_copy($ovmfvar_src, $ovmfvar_dst, 256*1024);
-       push @$cmd, '-drive', "if=pflash,format=raw,readonly,file=/usr/share/kvm/OVMF-pure-efi.fd";
-       push @$cmd, '-drive', "if=pflash,format=raw,file=$ovmfvar_dst";
-    }
-
-    if ($q35) {
-       # the q35 chipset support native usb2, so we enable usb controller
-       # by default for this machine type
-        push @$devices, '-readconfig', '/usr/share/qemu-server/pve-q35.cfg';
-    } else {
-        $pciaddr = print_pci_addr("piix3", $bridges);
-        push @$devices, '-device', "piix3-usb-uhci,id=uhci$pciaddr.0x2";
-
-        my $use_usb2 = 0;
-       for (my $i = 0; $i < $MAX_USB_DEVICES; $i++)  {
-           next if !$conf->{"usb$i"};
-           my $d = parse_usb_device($conf->{"usb$i"});
-           next if $d->{usb3}; # do not add usb2 controller if we have only usb3 devices
-           $use_usb2 = 1;
+       die "uefi base image not found\n" if ! -f $OVMF_CODE;
+
+       my $path;
+       my $format = 'raw';
+       if (my $efidisk = $conf->{efidisk0}) {
+           my $d = PVE::JSONSchema::parse_property_string($efidisk_fmt, $efidisk);
+           my ($storeid, $volname) = PVE::Storage::parse_volume_id($d->{file}, 1);
+           if ($storeid) {
+               $path = PVE::Storage::path($storecfg, $d->{file});
+           } else {
+               $path = $d->{file};
+           }
+           $format = $d->{format} if $d->{format};
+       } else {
+           warn "no efidisk configured! Using temporary efivars disk.\n";
+           $path = "/tmp/$vmid-ovmf.fd";
+           PVE::Tools::file_copy($OVMF_VARS, $path, -s $OVMF_VARS);
        }
-       # include usb device config
-       push @$devices, '-readconfig', '/usr/share/qemu-server/pve-usb.cfg' if $use_usb2;
-    }
-
-    # add usb3 controller if needed
 
-    my $use_usb3 = 0;
-    for (my $i = 0; $i < $MAX_USB_DEVICES; $i++)  {
-       next if !$conf->{"usb$i"};
-       my $d = parse_usb_device($conf->{"usb$i"});
-       next if !$d->{usb3};
-       $use_usb3 = 1;
+       push @$cmd, '-drive', "if=pflash,unit=0,format=raw,readonly,file=$OVMF_CODE";
+       push @$cmd, '-drive', "if=pflash,unit=1,format=$format,id=drive-efidisk0,file=$path";
     }
 
-    $pciaddr = print_pci_addr("xhci", $bridges);
-    push @$devices, '-device', "nec-usb-xhci,id=xhci$pciaddr" if $use_usb3;
 
+    # add usb controllers
+    my @usbcontrollers = PVE::QemuServer::USB::get_usb_controllers($conf, $bridges, $q35, $usbdesc->{format}, $MAX_USB_DEVICES);
+    push @$devices, @usbcontrollers if @usbcontrollers;
     my $vga = $conf->{vga};
 
     my $qxlnum = vga_conf_has_spice($vga);
     $vga = 'qxl' if $qxlnum;
 
     if (!$vga) {
-       if ($conf->{ostype} && ($conf->{ostype} eq 'win8' ||
-                               $conf->{ostype} eq 'win7' ||
-                               $conf->{ostype} eq 'w2k8')) {
-           $vga = 'std';
+       if (qemu_machine_feature_enabled($machine_type, $kvmver, 2, 9)) {
+           $vga = (!$winversion || $winversion >= 6) ? 'std' : 'cirrus';
        } else {
-           $vga = 'cirrus';
+           $vga = ($winversion >= 6) ? 'std' : 'cirrus';
        }
     }
 
@@ -2896,7 +2958,8 @@ sub config_to_command {
     push @$devices, '-device', print_tabletdevice_full($conf) if $tablet;
 
     my $kvm_off = 0;
-    my $nohyperv;
+    my $gpu_passthrough;
+
     # host pci devices
     for (my $i = 0; $i < $MAX_HOSTPCI_DEVICES; $i++)  {
        my $d = parse_hostpci($conf->{"hostpci$i"});
@@ -2910,12 +2973,16 @@ sub config_to_command {
            $pciaddr = print_pci_addr("hostpci$i", $bridges);
        }
 
-       my $rombar = $d->{rombar} && $d->{rombar} eq 'off' ? ",rombar=0" : "";
-       my $xvga = $d->{'x-vga'} && $d->{'x-vga'} eq 'on' ? ",x-vga=on" : "";
-       if ($xvga && $xvga ne '') {
+       my $rombar = defined($d->{rombar}) && !$d->{rombar} ? ',rombar=0' : '';
+       my $romfile = $d->{romfile};
+
+       my $xvga = '';
+       if ($d->{'x-vga'}) {
+           $xvga = ',x-vga=on';
            $kvm_off = 1;
            $vga = 'none';
-           $nohyperv = 1;
+           $gpu_passthrough = 1;
+
            if ($conf->{bios} && $conf->{bios} eq 'ovmf') {
                $xvga = "";
            }
@@ -2935,6 +3002,7 @@ sub config_to_command {
            if($j == 0){
                $devicestr .= "$rombar$xvga";
                $devicestr .= ",multifunction=on" if $multifunction;
+               $devicestr .= ",romfile=/usr/share/kvm/$romfile" if $romfile;
            }
 
            push @$devices, '-device', $devicestr;
@@ -2943,27 +3011,8 @@ sub config_to_command {
     }
 
     # usb devices
-    for (my $i = 0; $i < $MAX_USB_DEVICES; $i++)  {
-       my $d = parse_usb_device($conf->{"usb$i"});
-       next if !$d;
-
-       # if it is a usb3 device, attach it to the xhci controller, else omit the bus option
-       my $usbbus = '';
-       if ($d->{usb3}) {
-           $usbbus = ',bus=xhci.0';
-       }
-
-       if ($d->{vendorid} && $d->{productid}) {
-           push @$devices, '-device', "usb-host$usbbus,vendorid=0x$d->{vendorid},productid=0x$d->{productid}";
-       } elsif (defined($d->{hostbus}) && defined($d->{hostport})) {
-           push @$devices, '-device', "usb-host$usbbus,hostbus=$d->{hostbus},hostport=$d->{hostport}";
-       } elsif ($d->{spice}) {
-           # usb redir support for spice, currently no usb3
-           push @$devices, '-chardev', "spicevmc,id=usbredirchardev$i,name=usbredir";
-           push @$devices, '-device', "usb-redir,chardev=usbredirchardev$i,id=usbredirdev$i,bus=ehci.0";
-       }
-    }
-
+    my @usbdevices = PVE::QemuServer::USB::get_usb_devices($conf, $usbdesc->{format}, $MAX_USB_DEVICES);
+    push @$devices, @usbdevices if @usbdevices;
     # serial devices
     for (my $i = 0; $i < $MAX_SERIAL_PORTS; $i++)  {
        if (my $path = $conf->{"serial$i"}) {
@@ -3008,8 +3057,18 @@ sub config_to_command {
     die "MAX $allowed_vcpus vcpus allowed per VM on this node\n"
        if ($allowed_vcpus < $maxcpus);
 
-    push @$cmd, '-smp', "$vcpus,sockets=$sockets,cores=$cores,maxcpus=$maxcpus";
+    if($hotplug_features->{cpu} && qemu_machine_feature_enabled ($machine_type, $kvmver, 2, 7)) {
 
+       push @$cmd, '-smp', "1,sockets=$sockets,cores=$cores,maxcpus=$maxcpus";
+        for (my $i = 2; $i <= $vcpus; $i++)  {
+           my $cpustr = print_cpu_device($conf,$i);
+           push @$cmd, '-device', $cpustr;
+       }
+
+    } else {
+
+       push @$cmd, '-smp', "$vcpus,sockets=$sockets,cores=$cores,maxcpus=$maxcpus";
+    }
     push @$cmd, '-nodefaults';
 
     my $bootorder = $conf->{boot} || $confdesc->{boot}->{default};
@@ -3021,7 +3080,7 @@ sub config_to_command {
        $i++;
     }
 
-    push @$cmd, '-boot', "menu=on,strict=on,reboot-timeout=1000";
+    push @$cmd, '-boot', "menu=on,strict=on,reboot-timeout=1000,splash=/usr/share/qemu-server/bootsplash.jpg";
 
     push @$cmd, '-no-acpi' if defined($conf->{acpi}) && $conf->{acpi} == 0;
 
@@ -3029,49 +3088,36 @@ sub config_to_command {
 
     push @$cmd, '-vga', $vga if $vga && $vga !~ m/^serial\d+$/; # for kvm 77 and later
 
+    if ($vga && $vga !~ m/^serial\d+$/ && $vga ne 'none'){
+       my $socket = vnc_socket($vmid);
+       push @$cmd,  '-vnc', "unix:$socket,x509,password";
+    } else {
+       push @$cmd, '-nographic';
+    }
+
     # time drift fix
     my $tdf = defined($conf->{tdf}) ? $conf->{tdf} : $defaults->{tdf};
 
-    my $nokvm = defined($conf->{kvm}) && $conf->{kvm} == 0 ? 1 : 0;
     my $useLocaltime = $conf->{localtime};
 
-    if (my $ost = $conf->{ostype}) {
-       # other, wxp, w2k, w2k3, w2k8, wvista, win7, win8, l24, l26, solaris
+    if ($winversion >= 5) { # windows
+       $useLocaltime = 1 if !defined($conf->{localtime});
 
-       if ($ost =~ m/^w/) { # windows
-           $useLocaltime = 1 if !defined($conf->{localtime});
-
-           # use time drift fix when acpi is enabled
-           if (!(defined($conf->{acpi}) && $conf->{acpi} == 0)) {
-               $tdf = 1 if !defined($conf->{tdf});
-           }
-       }
-
-       if ($ost eq 'win7' || $ost eq 'win8' || $ost eq 'w2k8' ||
-           $ost eq 'wvista') {
-           push @$globalFlags, 'kvm-pit.lost_tick_policy=discard';
-           push @$cmd, '-no-hpet';
-           if (qemu_machine_feature_enabled ($machine_type, $kvmver, 2, 3)) {
-               push @$cpuFlags , 'hv_spinlocks=0x1fff' if !$nokvm && !$nohyperv;
-               push @$cpuFlags , 'hv_vapic' if !$nokvm && !$nohyperv;
-               push @$cpuFlags , 'hv_time' if !$nokvm && !$nohyperv;
-
-           } else {
-               push @$cpuFlags , 'hv_spinlocks=0xffff' if !$nokvm && !$nohyperv;
-           }
+       # use time drift fix when acpi is enabled
+       if (!(defined($conf->{acpi}) && $conf->{acpi} == 0)) {
+           $tdf = 1 if !defined($conf->{tdf});
        }
+    }
 
-       if ($ost eq 'win7' || $ost eq 'win8') {
-           push @$cpuFlags , 'hv_relaxed' if !$nokvm && !$nohyperv;
-       }
+    if ($winversion >= 6) {
+       push @$globalFlags, 'kvm-pit.lost_tick_policy=discard';
+       push @$cmd, '-no-hpet';
     }
 
     push @$rtcFlags, 'driftfix=slew' if $tdf;
 
-    if ($nokvm) {
+    if (!$kvm) {
        push @$machineFlags, 'accel=tcg';
-    } else {
-       die "No accelerator found!\n" if !$cpuinfo->{hvm};
     }
 
     if ($machine_type) {
@@ -3084,9 +3130,9 @@ sub config_to_command {
        push @$rtcFlags, 'base=localtime';
     }
 
-    my $cpu = $nokvm ? "qemu64" : "kvm64";
+    my $cpu = $kvm ? "kvm64" : "qemu64";
     if (my $cputype = $conf->{cpu}) {
-       my $cpuconf = PVE::JSONSchema::parse_property_string($cpudesc, $cputype)
+       my $cpuconf = PVE::JSONSchema::parse_property_string($cpu_fmt, $cputype)
            or die "Cannot parse cpu description: $cputype\n";
        $cpu = $cpuconf->{cputype};
        $kvm_off = 1 if $cpuconf->{hidden};
@@ -3103,119 +3149,28 @@ sub config_to_command {
 
     if (qemu_machine_feature_enabled ($machine_type, $kvmver, 2, 3)) {
 
-       push @$cpuFlags , '+kvm_pv_unhalt' if !$nokvm;
-       push @$cpuFlags , '+kvm_pv_eoi' if !$nokvm;
+       push @$cpuFlags , '+kvm_pv_unhalt' if $kvm;
+       push @$cpuFlags , '+kvm_pv_eoi' if $kvm;
     }
 
-    push @$cpuFlags, 'enforce' if $cpu ne 'host' && !$nokvm;
-
-    push @$cpuFlags, 'kvm=off' if $kvm_off;
-
-    $cpu .= "," . join(',', @$cpuFlags) if scalar(@$cpuFlags);
-
-    push @$cmd, '-cpu', $cpu;
-
-    my $memory = $conf->{memory} || $defaults->{memory};
-    my $static_memory = 0;
-    my $dimm_memory = 0;
-
-    if ($hotplug_features->{memory}) {
-       die "Numa need to be enabled for memory hotplug\n" if !$conf->{numa};
-       die "Total memory is bigger than ${MAX_MEM}MB\n" if $memory > $MAX_MEM;
-       $static_memory = $STATICMEM;
-       die "minimum memory must be ${static_memory}MB\n" if($memory < $static_memory);
-       $dimm_memory = $memory - $static_memory;
-       push @$cmd, '-m', "size=${static_memory},slots=255,maxmem=${MAX_MEM}M";
-
-    } else {
-
-       $static_memory = $memory;
-       push @$cmd, '-m', $static_memory;
-    }
-
-    if ($conf->{numa}) {
-
-       my $numa_totalmemory = undef;
-       for (my $i = 0; $i < $MAX_NUMA; $i++) {
-           next if !$conf->{"numa$i"};
-           my $numa = parse_numa($conf->{"numa$i"});
-           next if !$numa;
-           # memory
-           die "missing numa node$i memory value\n" if !$numa->{memory};
-           my $numa_memory = $numa->{memory};
-           $numa_totalmemory += $numa_memory;
-           my $numa_object = "memory-backend-ram,id=ram-node$i,size=${numa_memory}M";
-
-           # cpus
-           my $cpus_start = $numa->{cpus}->{start};
-           die "missing numa node$i cpus\n" if !defined($cpus_start);
-           my $cpus_end = $numa->{cpus}->{end} if defined($numa->{cpus}->{end});
-           my $cpus = $cpus_start;
-           if (defined($cpus_end)) {
-               $cpus .= "-$cpus_end";
-               die "numa node$i :  cpu range $cpus is incorrect\n" if $cpus_end <= $cpus_start;
-           }
-
-           # hostnodes
-           my $hostnodes_start = $numa->{hostnodes}->{start};
-           if (defined($hostnodes_start)) {
-               my $hostnodes_end = $numa->{hostnodes}->{end} if defined($numa->{hostnodes}->{end});
-               my $hostnodes = $hostnodes_start;
-               if (defined($hostnodes_end)) {
-                   $hostnodes .= "-$hostnodes_end";
-                   die "host node $hostnodes range is incorrect\n" if $hostnodes_end <= $hostnodes_start;
-               }
-
-               my $hostnodes_end_range = defined($hostnodes_end) ? $hostnodes_end : $hostnodes_start;
-               for (my $i = $hostnodes_start; $i <= $hostnodes_end_range; $i++ ) {
-                   die "host numa node$i don't exist\n" if ! -d "/sys/devices/system/node/node$i/";
-               }
-
-               # policy
-               my $policy = $numa->{policy};
-               die "you need to define a policy for hostnode $hostnodes\n" if !$policy;
-               $numa_object .= ",host-nodes=$hostnodes,policy=$policy";
-           }
-
-           push @$cmd, '-object', $numa_object;
-           push @$cmd, '-numa', "node,nodeid=$i,cpus=$cpus,memdev=ram-node$i";
-       }
-
-       die "total memory for NUMA nodes must be equal to vm static memory\n"
-           if $numa_totalmemory && $numa_totalmemory != $static_memory;
-
-       #if no custom tology, we split memory and cores across numa nodes
-       if(!$numa_totalmemory) {
+    add_hyperv_enlightenments($cpuFlags, $winversion, $machine_type, $kvmver, $conf->{bios}, $gpu_passthrough) if $kvm;
 
-           my $numa_memory = ($static_memory / $sockets) . "M";
+    push @$cpuFlags, 'enforce' if $cpu ne 'host' && $kvm;
 
-           for (my $i = 0; $i < $sockets; $i++)  {
+    push @$cpuFlags, 'kvm=off' if $kvm_off;
 
-               my $cpustart = ($cores * $i);
-               my $cpuend = ($cpustart + $cores - 1) if $cores && $cores > 1;
-               my $cpus = $cpustart;
-               $cpus .= "-$cpuend" if $cpuend;
+    my $cpu_vendor = $cpu_vendor_list->{$cpu} ||
+       die "internal error"; # should not happen
 
-               push @$cmd, '-object', "memory-backend-ram,size=$numa_memory,id=ram-node$i";
-               push @$cmd, '-numa', "node,nodeid=$i,cpus=$cpus,memdev=ram-node$i";
-           }
-       }
-    }
+    push @$cpuFlags, "vendor=${cpu_vendor}"
+       if $cpu_vendor ne 'default';
 
-    if ($hotplug_features->{memory}) {
-       foreach_dimm($conf, $vmid, $memory, $sockets, sub {
-           my ($conf, $vmid, $name, $dimm_size, $numanode, $current_size, $memory) = @_;
-           push @$cmd, "-object" , "memory-backend-ram,id=mem-$name,size=${dimm_size}M";
-           push @$cmd, "-device", "pc-dimm,id=$name,memdev=mem-$name,node=$numanode";
+    $cpu .= "," . join(',', @$cpuFlags) if scalar(@$cpuFlags);
 
-           #if dimm_memory is not aligned to dimm map
-           if($current_size > $memory) {
-                $conf->{memory} = $current_size;
-                update_config_nolock($vmid, $conf, 1);
-           }
-       });
-    }
+    push @$cmd, '-cpu', $cpu;
 
+    PVE::QemuServer::Memory::config($conf, $vmid, $sockets, $cores, $defaults, $hotplug_features, $cmd);
+    
     push @$cmd, '-S' if $conf->{freeze};
 
     # set keyboard layout
@@ -3239,7 +3194,7 @@ sub config_to_command {
 
     if ($qxlnum) {
        if ($qxlnum > 1) {
-           if ($conf->{ostype} && $conf->{ostype} =~ m/^w/){
+           if ($winversion){
                for(my $i = 1; $i < $qxlnum; $i++){
                    my $pciaddr = print_pci_addr("vga$i", $bridges);
                    push @$cmd, '-device', "qxl,id=vga$i,ram_size=67108864,vram_size=33554432$pciaddr";
@@ -3255,9 +3210,12 @@ sub config_to_command {
 
        my $nodename = PVE::INotify::nodename();
        my $pfamily = PVE::Tools::get_host_address_family($nodename);
-       $spice_port = PVE::Tools::next_spice_port($pfamily);
+       my @nodeaddrs = PVE::Tools::getaddrinfo_all('localhost', family => $pfamily);
+       die "failed to get an ip address of type $pfamily for 'localhost'\n" if !@nodeaddrs;
+       my $localhost = PVE::Network::addr_to_ip($nodeaddrs[0]->{addr});
+       $spice_port = PVE::Tools::next_spice_port($pfamily, $localhost);
 
-       push @$devices, '-spice', "tls-port=${spice_port},addr=localhost,tls-ciphers=DES-CBC3-SHA,seamless-migration=on";
+       push @$devices, '-spice', "tls-port=${spice_port},addr=$localhost,tls-ciphers=HIGH,seamless-migration=on";
 
        push @$devices, '-device', "virtio-serial,id=spice$pciaddr";
        push @$devices, '-chardev', "spicevmc,id=vdagent,name=vdagent";
@@ -3295,6 +3253,9 @@ sub config_to_command {
            push @$vollist, $drive->{file};
        }
 
+       # ignore efidisk here, already added in bios/fw handling code above
+       return if $drive->{interface} eq 'efidisk';
+
        $use_virtio = 1 if $ds =~ m/^virtio/;
 
        if (drive_is_cdrom ($drive)) {
@@ -3324,6 +3285,8 @@ sub config_to_command {
            if($conf->{scsihw} && $conf->{scsihw} eq "virtio-scsi-single" && $drive->{iothread}){
                $iothread .= ",iothread=iothread-$controller_prefix$controller";
                push @$cmd, '-object', "iothread,id=iothread-$controller_prefix$controller";
+           } elsif ($drive->{iothread}) {
+               warn "iothread is only valid with virtio disk or virtio-scsi-single controller, ignoring\n";
            }
 
            my $queues = '';
@@ -3458,6 +3421,16 @@ sub vm_devices_list {
        }
     }
 
+    # for usb devices there is no query-usb
+    # but we can iterate over the entries in
+    # qom-list path=/machine/peripheral
+    my $resperipheral = vm_mon_cmd($vmid, 'qom-list', path => '/machine/peripheral');
+    foreach my $per (@$resperipheral) {
+       if ($per->{name} =~ m/^usb\d+$/) {
+           $devices->{$per->{name}} = 1;
+       }
+    }
+
     return $devices;
 }
 
@@ -3475,6 +3448,14 @@ sub vm_deviceplug {
 
        qemu_deviceadd($vmid, print_tabletdevice_full($conf));
 
+    } elsif ($deviceid =~ m/^usb(\d+)$/) {
+
+       die "usb hotplug currently not reliable\n";
+       # since we can't reliably hot unplug all added usb devices
+       # and usb passthrough disables live migration
+       # we disable usb hotplugging for now
+       qemu_deviceadd($vmid, PVE::QemuServer::USB::print_usbdevice_full($conf, $deviceid, $device));
+
     } elsif ($deviceid =~ m/^(virtio)(\d+)$/) {
 
        qemu_iothread_add($vmid, $deviceid, $device);
@@ -3570,6 +3551,15 @@ sub vm_deviceunplug {
 
        qemu_devicedel($vmid, $deviceid);
 
+    } elsif ($deviceid =~ m/^usb\d+$/) {
+
+       die "usb hotplug currently not reliable\n";
+       # when unplugging usb devices this way,
+       # there may be remaining usb controllers/hubs
+       # so we disable it for now
+       qemu_devicedel($vmid, $deviceid);
+       qemu_devicedelverify($vmid, $deviceid);
+
     } elsif ($deviceid =~ m/^(virtio)(\d+)$/) {
 
         qemu_devicedel($vmid, $deviceid);
@@ -3740,7 +3730,7 @@ sub qemu_deletescsihw {
 
     my $devices_list = vm_devices_list($vmid);
     foreach my $opt (keys %{$devices_list}) {
-       if (PVE::QemuServer::valid_drivename($opt)) {
+       if (PVE::QemuServer::is_valid_drivename($opt)) {
            my $drive = PVE::QemuServer::parse_drive($opt, $conf->{$opt});
            if($drive->{interface} eq 'scsi' && $drive->{index} < (($maxdev-1)*($controller+1))) {
                return 1;
@@ -3802,9 +3792,36 @@ sub qemu_netdevdel {
     vm_mon_cmd($vmid, "netdev_del", id => $deviceid);
 }
 
+sub qemu_usb_hotplug {
+    my ($storecfg, $conf, $vmid, $deviceid, $device) = @_;
+
+    return if !$device;
+
+    # remove the old one first
+    vm_deviceunplug($vmid, $conf, $deviceid);
+
+    # check if xhci controller is necessary and available
+    if ($device->{usb3}) {
+
+       my $devicelist = vm_devices_list($vmid);
+
+       if (!$devicelist->{xhci}) {
+           my $pciaddr = print_pci_addr("xhci");
+           qemu_deviceadd($vmid, "nec-usb-xhci,id=xhci$pciaddr");
+       }
+    }
+    my $d = parse_usb_device($device->{host});
+    $d->{usb3} = $device->{usb3};
+
+    # add the new one
+    vm_deviceplug($storecfg, $conf, $vmid, $deviceid, $d);
+}
+
 sub qemu_cpu_hotplug {
     my ($vmid, $conf, $vcpus) = @_;
 
+    my $machine_type = PVE::QemuServer::get_current_qemu_machine($vmid);
+
     my $sockets = 1;
     $sockets = $conf->{smp} if $conf->{smp}; # old style - no longer iused
     $sockets = $conf->{sockets} if  $conf->{sockets};
@@ -3817,108 +3834,70 @@ sub qemu_cpu_hotplug {
        if $vcpus > $maxcpus;
 
     my $currentvcpus = $conf->{vcpus} || $maxcpus;
-    die "online cpu unplug is not yet possible\n"
-       if $vcpus < $currentvcpus;
 
-    my $currentrunningvcpus = vm_mon_cmd($vmid, "query-cpus");
-    die "vcpus in running vm is different than configuration\n"
-       if scalar(@{$currentrunningvcpus}) != $currentvcpus;
-
-    for (my $i = $currentvcpus; $i < $vcpus; $i++) {
-       vm_mon_cmd($vmid, "cpu-add", id => int($i));
-    }
-}
+    if ($vcpus < $currentvcpus) {
 
-sub qemu_memory_hotplug {
-    my ($vmid, $conf, $defaults, $opt, $value) = @_;
+       if (qemu_machine_feature_enabled ($machine_type, undef, 2, 7)) {
 
-    return $value if !check_running($vmid);
+           for (my $i = $currentvcpus; $i > $vcpus; $i--) {
+               qemu_devicedel($vmid, "cpu$i");
+               my $retry = 0;
+               my $currentrunningvcpus = undef;
+               while (1) {
+                   $currentrunningvcpus = vm_mon_cmd($vmid, "query-cpus");
+                   last if scalar(@{$currentrunningvcpus}) == $i-1;
+                   raise_param_exc({ vcpus => "error unplugging cpu$i" }) if $retry > 5;
+                   $retry++;
+                   sleep 1;
+               }
+               #update conf after each succesfull cpu unplug
+               $conf->{vcpus} = scalar(@{$currentrunningvcpus});
+               PVE::QemuConfig->write_config($vmid, $conf);
+           }
+       } else {
+           die "cpu hot-unplugging requires qemu version 2.7 or higher\n";
+       }
 
-    my $memory = $conf->{memory} || $defaults->{memory};
-    $value = $defaults->{memory} if !$value;
-    return $value if $value == $memory;
+       return;
+    }
 
-    my $static_memory = $STATICMEM;
-    my $dimm_memory = $memory - $static_memory;
+    my $currentrunningvcpus = vm_mon_cmd($vmid, "query-cpus");
+    die "vcpus in running vm does not match its configuration\n"
+       if scalar(@{$currentrunningvcpus}) != $currentvcpus;
 
-    die "memory can't be lower than $static_memory MB" if $value < $static_memory;
-    die "you cannot add more memory than $MAX_MEM MB!\n" if $memory > $MAX_MEM;
+    if (qemu_machine_feature_enabled ($machine_type, undef, 2, 7)) {
 
+       for (my $i = $currentvcpus+1; $i <= $vcpus; $i++) {
+           my $cpustr = print_cpu_device($conf, $i);
+           qemu_deviceadd($vmid, $cpustr);
 
-    my $sockets = 1;
-    $sockets = $conf->{sockets} if $conf->{sockets};
-
-    if($value > $memory) {
-
-       foreach_dimm($conf, $vmid, $value, $sockets, sub {
-           my ($conf, $vmid, $name, $dimm_size, $numanode, $current_size, $memory) = @_;
-
-               return if $current_size <= $conf->{memory};
-
-               eval { vm_mon_cmd($vmid, "object-add", 'qom-type' => "memory-backend-ram", id => "mem-$name", props => { size => int($dimm_size*1024*1024) } ) };
-               if (my $err = $@) {
-                   eval { qemu_objectdel($vmid, "mem-$name"); };
-                   die $err;
-               }
-
-               eval { vm_mon_cmd($vmid, "device_add", driver => "pc-dimm", id => "$name", memdev => "mem-$name", node => $numanode) };
-               if (my $err = $@) {
-                   eval { qemu_objectdel($vmid, "mem-$name"); };
-                   die $err;
-               }
-               #update conf after each succesful module hotplug
-               $conf->{memory} = $current_size;
-               update_config_nolock($vmid, $conf, 1);
-       });
-
+           my $retry = 0;
+           my $currentrunningvcpus = undef;
+           while (1) {
+               $currentrunningvcpus = vm_mon_cmd($vmid, "query-cpus");
+               last if scalar(@{$currentrunningvcpus}) == $i;
+               raise_param_exc({ vcpus => "error hotplugging cpu$i" }) if $retry > 10;
+               sleep 1;
+               $retry++;
+           }
+            #update conf after each succesfull cpu hotplug
+           $conf->{vcpus} = scalar(@{$currentrunningvcpus});
+           PVE::QemuConfig->write_config($vmid, $conf);
+       }
     } else {
 
-       foreach_reverse_dimm($conf, $vmid, $value, $sockets, sub {
-           my ($conf, $vmid, $name, $dimm_size, $numanode, $current_size, $memory) = @_;
-
-               return if $current_size >= $conf->{memory};
-               print "try to unplug memory dimm $name\n";
-
-               my $retry = 0;
-               while (1) {
-                   eval { qemu_devicedel($vmid, $name) };
-                   sleep 3;
-                   my $dimm_list = qemu_dimm_list($vmid);
-                   last if !$dimm_list->{$name};
-                   raise_param_exc({ $name => "error unplug memory module" }) if $retry > 5;
-                   $retry++;
-               }
-
-               #update conf after each succesful module unplug
-               $conf->{memory} = $current_size;
-
-               eval { qemu_objectdel($vmid, "mem-$name"); };
-               update_config_nolock($vmid, $conf, 1);
-       });
-    }
-}
-
-sub qemu_dimm_list {
-    my ($vmid) = @_;
-
-    my $dimmarray = vm_mon_cmd_nocheck($vmid, "query-memory-devices");
-    my $dimms = {};
-
-    foreach my $dimm (@$dimmarray) {
-
-        $dimms->{$dimm->{data}->{id}}->{id} = $dimm->{data}->{id};
-        $dimms->{$dimm->{data}->{id}}->{node} = $dimm->{data}->{node};
-        $dimms->{$dimm->{data}->{id}}->{addr} = $dimm->{data}->{addr};
-        $dimms->{$dimm->{data}->{id}}->{size} = $dimm->{data}->{size};
-        $dimms->{$dimm->{data}->{id}}->{slot} = $dimm->{data}->{slot};
+       for (my $i = $currentvcpus; $i < $vcpus; $i++) {
+           vm_mon_cmd($vmid, "cpu-add", id => int($i));
+       }
     }
-    return $dimms;
 }
 
 sub qemu_block_set_io_throttle {
     my ($vmid, $deviceid,
        $bps, $bps_rd, $bps_wr, $iops, $iops_rd, $iops_wr,
-       $bps_max, $bps_rd_max, $bps_wr_max, $iops_max, $iops_rd_max, $iops_wr_max) = @_;
+       $bps_max, $bps_rd_max, $bps_wr_max, $iops_max, $iops_rd_max, $iops_wr_max,
+       $bps_max_length, $bps_rd_max_length, $bps_wr_max_length,
+       $iops_max_length, $iops_rd_max_length, $iops_wr_max_length) = @_;
 
     return if !check_running($vmid) ;
 
@@ -3934,7 +3913,13 @@ sub qemu_block_set_io_throttle {
        bps_wr_max => int($bps_wr_max),
        iops_max => int($iops_max),
        iops_rd_max => int($iops_rd_max),
-       iops_wr_max => int($iops_wr_max)
+       iops_wr_max => int($iops_wr_max),
+       bps_max_length => int($bps_max_length),
+       bps_rd_max_length => int($bps_rd_max_length),
+       bps_wr_max_length => int($bps_wr_max_length),
+       iops_max_length => int($iops_max_length),
+       iops_rd_max_length => int($iops_rd_max_length),
+       iops_wr_max_length => int($iops_wr_max_length),
     );
 
 }
@@ -4052,7 +4037,7 @@ sub qemu_block_resize {
 
     my $running = check_running($vmid);
 
-    return if !PVE::Storage::volume_resize($storecfg, $volid, $size, $running);
+    $size = 0 if !PVE::Storage::volume_resize($storecfg, $volid, $size, $running);
 
     return if !$running;
 
@@ -4077,11 +4062,11 @@ sub qemu_volume_snapshot_delete {
 
     my $running = check_running($vmid);
 
-    return if !PVE::Storage::volume_snapshot_delete($storecfg, $volid, $snap, $running);
-
-    return if !$running;
-
-    vm_mon_cmd($vmid, "delete-drive-snapshot", device => $deviceid, name => $snap);
+    if ($running && do_snapshots_with_qemu($storecfg, $volid)){
+       vm_mon_cmd($vmid, "delete-drive-snapshot", device => $deviceid, name => $snap);
+    } else {
+       PVE::Storage::volume_snapshot_delete($storecfg, $volid, $snap, $running);
+    }
 }
 
 sub set_migration_caps {
@@ -4116,6 +4101,8 @@ my $fast_plug_option = {
     'shares' => 1,
     'startup' => 1,
     'description' => 1,
+    'protection' => 1,
+    'vmstatestorage' => 1,
 };
 
 # hotplug changes in [PENDING]
@@ -4146,8 +4133,8 @@ sub vmconfig_hotplug_pending {
     }
 
     if ($changes) {
-       update_config_nolock($vmid, $conf, 1);
-       $conf = load_config($vmid); # update/reload
+       PVE::QemuConfig->write_config($vmid, $conf);
+       $conf = PVE::QemuConfig->load_config($vmid); # update/reload
     }
 
     my $hotplug_features = parse_hotplug_features(defined($conf->{hotplug}) ? $conf->{hotplug} : '1');
@@ -4165,6 +4152,12 @@ sub vmconfig_hotplug_pending {
                } else {
                    vm_deviceunplug($vmid, $conf, $opt);
                }
+           } elsif ($opt =~ m/^usb\d+/) {
+               die "skip\n";
+               # since we cannot reliably hot unplug usb devices
+               # we are disabling it
+               die "skip\n" if !$hotplug_features->{usb} || $conf->{$opt} =~ m/spice/i;
+               vm_deviceunplug($vmid, $conf, $opt);
            } elsif ($opt eq 'vcpus') {
                die "skip\n" if !$hotplug_features->{cpu};
                qemu_cpu_hotplug($vmid, $conf, undef);
@@ -4176,13 +4169,13 @@ sub vmconfig_hotplug_pending {
            } elsif ($opt =~ m/^net(\d+)$/) {
                die "skip\n" if !$hotplug_features->{network};
                vm_deviceunplug($vmid, $conf, $opt);
-           } elsif (valid_drivename($opt)) {
+           } elsif (is_valid_drivename($opt)) {
                die "skip\n" if !$hotplug_features->{disk} || $opt =~ m/(ide|sata)(\d+)/;
                vm_deviceunplug($vmid, $conf, $opt);
                vmconfig_delete_or_detach_drive($vmid, $storecfg, $conf, $opt, $force);
            } elsif ($opt =~ m/^memory$/) {
                die "skip\n" if !$hotplug_features->{memory};
-               qemu_memory_hotplug($vmid, $conf, $defaults, $opt);
+               PVE::QemuServer::Memory::qemu_memory_hotplug($vmid, $conf, $defaults, $opt);
            } elsif ($opt eq 'cpuunits') {
                cgroups_write("cpu", $vmid, "cpu.shares", $defaults->{cpuunits});
            } elsif ($opt eq 'cpulimit') {
@@ -4197,8 +4190,8 @@ sub vmconfig_hotplug_pending {
            # save new config if hotplug was successful
            delete $conf->{$opt};
            vmconfig_undelete_pending_option($conf, $opt);
-           update_config_nolock($vmid, $conf, 1);
-           $conf = load_config($vmid); # update/reload
+           PVE::QemuConfig->write_config($vmid, $conf);
+           $conf = PVE::QemuConfig->load_config($vmid); # update/reload
        }
     }
 
@@ -4215,6 +4208,14 @@ sub vmconfig_hotplug_pending {
                } elsif ($value == 0) {
                    vm_deviceunplug($vmid, $conf, $opt);
                }
+           } elsif ($opt =~ m/^usb\d+$/) {
+               die "skip\n";
+               # since we cannot reliably hot unplug usb devices
+               # we are disabling it
+               die "skip\n" if !$hotplug_features->{usb} || $value =~ m/spice/i;
+               my $d = eval { PVE::JSONSchema::parse_property_string($usbdesc->{format}, $value) };
+               die "skip\n" if !$d;
+               qemu_usb_hotplug($storecfg, $conf, $vmid, $opt, $d);
            } elsif ($opt eq 'vcpus') {
                die "skip\n" if !$hotplug_features->{cpu};
                qemu_cpu_hotplug($vmid, $conf, $value);
@@ -4233,13 +4234,13 @@ sub vmconfig_hotplug_pending {
                # some changes can be done without hotplug
                vmconfig_update_net($storecfg, $conf, $hotplug_features->{network},
                                    $vmid, $opt, $value);
-           } elsif (valid_drivename($opt)) {
+           } elsif (is_valid_drivename($opt)) {
                # some changes can be done without hotplug
                vmconfig_update_disk($storecfg, $conf, $hotplug_features->{disk},
                                     $vmid, $opt, $value, 1);
            } elsif ($opt =~ m/^memory$/) { #dimms
                die "skip\n" if !$hotplug_features->{memory};
-               $value = qemu_memory_hotplug($vmid, $conf, $defaults, $opt, $value);
+               $value = PVE::QemuServer::Memory::qemu_memory_hotplug($vmid, $conf, $defaults, $opt, $value);
            } elsif ($opt eq 'cpuunits') {
                cgroups_write("cpu", $vmid, "cpu.shares", $conf->{pending}->{$opt});
            } elsif ($opt eq 'cpulimit') {
@@ -4255,8 +4256,8 @@ sub vmconfig_hotplug_pending {
            # save new config if hotplug was successful
            $conf->{$opt} = $value;
            delete $conf->{pending}->{$opt};
-           update_config_nolock($vmid, $conf, 1);
-           $conf = load_config($vmid); # update/reload
+           PVE::QemuConfig->write_config($vmid, $conf);
+           $conf = PVE::QemuConfig->load_config($vmid); # update/reload
        }
     }
 }
@@ -4308,30 +4309,30 @@ sub vmconfig_apply_pending {
     my $pending_delete_hash = split_flagged_list($conf->{pending}->{delete});
     while (my ($opt, $force) = each %$pending_delete_hash) {
        die "internal error" if $opt =~ m/^unused/;
-       $conf = load_config($vmid); # update/reload
+       $conf = PVE::QemuConfig->load_config($vmid); # update/reload
        if (!defined($conf->{$opt})) {
            vmconfig_undelete_pending_option($conf, $opt);
-           update_config_nolock($vmid, $conf, 1);
-       } elsif (valid_drivename($opt)) {
+           PVE::QemuConfig->write_config($vmid, $conf);
+       } elsif (is_valid_drivename($opt)) {
            vmconfig_delete_or_detach_drive($vmid, $storecfg, $conf, $opt, $force);
            vmconfig_undelete_pending_option($conf, $opt);
            delete $conf->{$opt};
-           update_config_nolock($vmid, $conf, 1);
+           PVE::QemuConfig->write_config($vmid, $conf);
        } else {
            vmconfig_undelete_pending_option($conf, $opt);
            delete $conf->{$opt};
-           update_config_nolock($vmid, $conf, 1);
+           PVE::QemuConfig->write_config($vmid, $conf);
        }
     }
 
-    $conf = load_config($vmid); # update/reload
+    $conf = PVE::QemuConfig->load_config($vmid); # update/reload
 
     foreach my $opt (keys %{$conf->{pending}}) { # add/change
-       $conf = load_config($vmid); # update/reload
+       $conf = PVE::QemuConfig->load_config($vmid); # update/reload
 
        if (defined($conf->{$opt}) && ($conf->{$opt} eq $conf->{pending}->{$opt})) {
            # skip if nothing changed
-       } elsif (valid_drivename($opt)) {
+       } elsif (is_valid_drivename($opt)) {
            vmconfig_register_unused_drive($storecfg, $vmid, $conf, parse_drive($opt, $conf->{$opt}))
                if defined($conf->{$opt});
            $conf->{$opt} = $conf->{pending}->{$opt};
@@ -4340,7 +4341,7 @@ sub vmconfig_apply_pending {
        }
 
        delete $conf->{pending}->{$opt};
-       update_config_nolock($vmid, $conf, 1);
+       PVE::QemuConfig->write_config($vmid, $conf);
     }
 }
 
@@ -4385,16 +4386,16 @@ sub vmconfig_update_net {
            die "internal error" if $opt !~ m/net(\d+)/;
            my $iface = "tap${vmid}i$1";
 
-           if (&$safe_num_ne($oldnet->{rate}, $newnet->{rate})) {
-               PVE::Network::tap_rate_limit($iface, $newnet->{rate});
-           }
-
            if (&$safe_string_ne($oldnet->{bridge}, $newnet->{bridge}) ||
                &$safe_num_ne($oldnet->{tag}, $newnet->{tag}) ||
                &$safe_string_ne($oldnet->{trunks}, $newnet->{trunks}) ||
                &$safe_num_ne($oldnet->{firewall}, $newnet->{firewall})) {
                PVE::Network::tap_unplug($iface);
-               PVE::Network::tap_plug($iface, $newnet->{bridge}, $newnet->{tag}, $newnet->{firewall}, $newnet->{trunks});
+               PVE::Network::tap_plug($iface, $newnet->{bridge}, $newnet->{tag}, $newnet->{firewall}, $newnet->{trunks}, $newnet->{rate});
+           } elsif (&$safe_num_ne($oldnet->{rate}, $newnet->{rate})) {
+               # Rate can be applied on its own but any change above needs to
+               # include the rate in tap_plug since OVS resets everything.
+               PVE::Network::tap_rate_limit($iface, $newnet->{rate});
            }
 
            if (&$safe_string_ne($oldnet->{link_down}, $newnet->{link_down})) {
@@ -4441,7 +4442,7 @@ sub vmconfig_update_disk {
                    # update existing disk
 
                    # skip non hotpluggable value
-                   if (&$safe_num_ne($drive->{discard}, $old_drive->{discard}) ||
+                   if (&$safe_string_ne($drive->{discard}, $old_drive->{discard}) ||
                        &$safe_string_ne($drive->{iothread}, $old_drive->{iothread}) ||
                        &$safe_string_ne($drive->{queues}, $old_drive->{queues}) ||
                        &$safe_string_ne($drive->{cache}, $old_drive->{cache})) {
@@ -4460,7 +4461,13 @@ sub vmconfig_update_disk {
                        &$safe_num_ne($drive->{mbps_wr_max}, $old_drive->{mbps_wr_max}) ||
                        &$safe_num_ne($drive->{iops_max}, $old_drive->{iops_max}) ||
                        &$safe_num_ne($drive->{iops_rd_max}, $old_drive->{iops_rd_max}) ||
-                       &$safe_num_ne($drive->{iops_wr_max}, $old_drive->{iops_wr_max})) {
+                       &$safe_num_ne($drive->{iops_wr_max}, $old_drive->{iops_wr_max}) ||
+                       &$safe_num_ne($drive->{bps_max_length}, $old_drive->{bps_max_length}) ||
+                       &$safe_num_ne($drive->{bps_rd_max_length}, $old_drive->{bps_rd_max_length}) ||
+                       &$safe_num_ne($drive->{bps_wr_max_length}, $old_drive->{bps_wr_max_length}) ||
+                       &$safe_num_ne($drive->{iops_max_length}, $old_drive->{iops_max_length}) ||
+                       &$safe_num_ne($drive->{iops_rd_max_length}, $old_drive->{iops_rd_max_length}) ||
+                       &$safe_num_ne($drive->{iops_wr_max_length}, $old_drive->{iops_wr_max_length})) {
 
                        qemu_block_set_io_throttle($vmid,"drive-$opt",
                                                   ($drive->{mbps} || 0)*1024*1024,
@@ -4474,7 +4481,13 @@ sub vmconfig_update_disk {
                                                   ($drive->{mbps_wr_max} || 0)*1024*1024,
                                                   $drive->{iops_max} || 0,
                                                   $drive->{iops_rd_max} || 0,
-                                                  $drive->{iops_wr_max} || 0);
+                                                  $drive->{iops_wr_max} || 0,
+                                                  $drive->{bps_max_length} || 1,
+                                                  $drive->{bps_rd_max_length} || 1,
+                                                  $drive->{bps_wr_max_length} || 1,
+                                                  $drive->{iops_max_length} || 1,
+                                                  $drive->{iops_rd_max_length} || 1,
+                                                  $drive->{iops_wr_max_length} || 1);
 
                    }
 
@@ -4504,20 +4517,20 @@ sub vmconfig_update_disk {
 
 sub vm_start {
     my ($storecfg, $vmid, $statefile, $skiplock, $migratedfrom, $paused,
-       $forcemachine, $spice_ticket) = @_;
+       $forcemachine, $spice_ticket, $migration_network, $migration_type, $targetstorage) = @_;
 
-    lock_config($vmid, sub {
-       my $conf = load_config($vmid, $migratedfrom);
+    PVE::QemuConfig->lock_config($vmid, sub {
+       my $conf = PVE::QemuConfig->load_config($vmid, $migratedfrom);
 
-       die "you can't start a vm if it's a template\n" if is_template($conf);
+       die "you can't start a vm if it's a template\n" if PVE::QemuConfig->is_template($conf);
 
-       check_lock($conf) if !$skiplock;
+       PVE::QemuConfig->check_lock($conf) if !$skiplock;
 
        die "VM $vmid already running\n" if check_running($vmid, undef, $migratedfrom);
 
        if (!$statefile && scalar(keys %{$conf->{pending}})) {
            vmconfig_apply_pending($vmid, $conf, $storecfg);
-           $conf = load_config($vmid); # update/reload
+           $conf = PVE::QemuConfig->load_config($vmid); # update/reload
        }
 
        my $defaults = load_defaults();
@@ -4525,6 +4538,54 @@ sub vm_start {
        # set environment variable useful inside network script
        $ENV{PVE_MIGRATED_FROM} = $migratedfrom if $migratedfrom;
 
+       my $local_volumes = {};
+
+       if ($targetstorage) {
+           foreach_drive($conf, sub {
+               my ($ds, $drive) = @_;
+
+               return if drive_is_cdrom($drive);
+
+               my $volid = $drive->{file};
+
+               return if !$volid;
+
+               my ($storeid, $volname) = PVE::Storage::parse_volume_id($volid);
+
+               my $scfg = PVE::Storage::storage_config($storecfg, $storeid);
+               return if $scfg->{shared};
+               $local_volumes->{$ds} = [$volid, $storeid, $volname];
+           });
+
+           my $format = undef;
+
+           foreach my $opt (sort keys %$local_volumes) {
+
+               my ($volid, $storeid, $volname) = @{$local_volumes->{$opt}};
+               my $drive = parse_drive($opt, $conf->{$opt});
+
+               #if remote storage is specified, use default format
+               if ($targetstorage && $targetstorage ne "1") {
+                   $storeid = $targetstorage;
+                   my ($defFormat, $validFormats) = PVE::Storage::storage_default_format($storecfg, $storeid);
+                   $format = $defFormat;
+               } else {
+                   #else we use same format than original
+                   my $scfg = PVE::Storage::storage_config($storecfg, $storeid);
+                   $format = qemu_img_format($scfg, $volid);
+               }
+
+               my $newvolid = PVE::Storage::vdisk_alloc($storecfg, $storeid, $vmid, $format, undef, ($drive->{size}/1024));
+               my $newdrive = $drive;
+               $newdrive->{format} = $format;
+               $newdrive->{file} = $newvolid;
+               my $drivestr = PVE::QemuServer::print_drive($vmid, $newdrive);
+               $local_volumes->{$opt} = $drivestr;
+               #pass drive to conf for command line
+               $conf->{$opt} = $drivestr;
+           }
+       }
+
        my ($cmd, $vollist, $spice_port) = config_to_command($storecfg, $vmid, $conf, $defaults, $forcemachine);
 
        my $migrate_port = 0;
@@ -4534,15 +4595,44 @@ sub vm_start {
                my $localip = "localhost";
                my $datacenterconf = PVE::Cluster::cfs_read_file('datacenter.cfg');
                my $nodename = PVE::INotify::nodename();
-               if ($datacenterconf->{migration_unsecure}) {
+
+               if (!defined($migration_type)) {
+                   if (defined($datacenterconf->{migration}->{type})) {
+                       $migration_type = $datacenterconf->{migration}->{type};
+                   } else {
+                       $migration_type = 'secure';
+                   }
+               }
+
+               if ($migration_type eq 'insecure') {
+                   my $migrate_network_addr = PVE::Cluster::get_local_migration_ip($migration_network);
+                   if ($migrate_network_addr) {
+                       $localip = $migrate_network_addr;
+                   } else {
                        $localip = PVE::Cluster::remote_node_ip($nodename, 1);
-                       $localip = "[$localip]" if Net::IP::ip_is_ipv6($localip);
+                   }
+
+                   $localip = "[$localip]" if Net::IP::ip_is_ipv6($localip);
                }
+
                my $pfamily = PVE::Tools::get_host_address_family($nodename);
                $migrate_port = PVE::Tools::next_migrate_port($pfamily);
                $migrate_uri = "tcp:${localip}:${migrate_port}";
                push @$cmd, '-incoming', $migrate_uri;
                push @$cmd, '-S';
+
+           } elsif ($statefile eq 'unix') {
+               # should be default for secure migrations as a ssh TCP forward
+               # tunnel is not deterministic reliable ready and fails regurarly
+               # to set up in time, so use UNIX socket forwards
+               my $socket_addr = "/run/qemu-server/$vmid.migrate";
+               unlink $socket_addr;
+
+               $migrate_uri = "unix:$socket_addr";
+
+               push @$cmd, '-incoming', $migrate_uri;
+               push @$cmd, '-S';
+
            } else {
                push @$cmd, '-loadstate', $statefile;
            }
@@ -4568,20 +4658,92 @@ sub vm_start {
 
        PVE::Storage::activate_volumes($storecfg, $vollist);
 
-       eval  { run_command($cmd, timeout => $statefile ? undef : 30,
-                   umask => 0077); };
-       my $err = $@;
-       die "start failed: $err" if $err;
+       if (!check_running($vmid, 1) && -d "/sys/fs/cgroup/systemd/qemu.slice/$vmid.scope") {
+           my $cmd = [];
+           push @$cmd, '/bin/systemctl', 'stop', "$vmid.scope";
+           eval  { run_command($cmd); };
+       }
+
+       my $cpuunits = defined($conf->{cpuunits}) ? $conf->{cpuunits}
+                                                 : $defaults->{cpuunits};
+
+       my %run_params = (timeout => $statefile ? undef : 30, umask => 0077);
+
+       my %properties = (
+           Slice => 'qemu.slice',
+           KillMode => 'none',
+           CPUShares => $cpuunits
+       );
+
+       if (my $cpulimit = $conf->{cpulimit}) {
+           $properties{CPUQuota} = int($cpulimit * 100);
+       }
+       $properties{timeout} = 10 if $statefile; # setting up the scope shoul be quick
+
+       if ($conf->{hugepages}) {
+
+           my $code = sub {
+               my $hugepages_topology = PVE::QemuServer::Memory::hugepages_topology($conf);
+               my $hugepages_host_topology = PVE::QemuServer::Memory::hugepages_host_topology();
+
+               PVE::QemuServer::Memory::hugepages_mount();
+               PVE::QemuServer::Memory::hugepages_allocate($hugepages_topology, $hugepages_host_topology);
+
+               eval  {
+                   PVE::Tools::enter_systemd_scope($vmid, "Proxmox VE VM $vmid", %properties);
+                   run_command($cmd, %run_params);
+               };
+
+               if (my $err = $@) {
+                   PVE::QemuServer::Memory::hugepages_reset($hugepages_host_topology);
+                   die $err;
+               }
+
+               PVE::QemuServer::Memory::hugepages_pre_deallocate($hugepages_topology);
+           };
+           eval { PVE::QemuServer::Memory::hugepages_update_locked($code); };
+
+       } else {
+           eval  {
+               PVE::Tools::enter_systemd_scope($vmid, "Proxmox VE VM $vmid", %properties);
+               run_command($cmd, %run_params);
+           };
+       }
+
+       if (my $err = $@) {
+           # deactivate volumes if start fails
+           eval { PVE::Storage::deactivate_volumes($storecfg, $vollist); };
+           die "start failed: $err";
+       }
 
        print "migration listens on $migrate_uri\n" if $migrate_uri;
 
-       if ($statefile && $statefile ne 'tcp')  {
+       if ($statefile && $statefile ne 'tcp' && $statefile ne 'unix')  {
            eval { vm_mon_cmd_nocheck($vmid, "cont"); };
            warn $@ if $@;
        }
 
-       if ($migratedfrom) {
+       #start nbd server for storage migration
+       if ($targetstorage) {
+           my $nodename = PVE::INotify::nodename();
+           my $migrate_network_addr = PVE::Cluster::get_local_migration_ip($migration_network);
+           my $localip = $migrate_network_addr ? $migrate_network_addr : PVE::Cluster::remote_node_ip($nodename, 1);
+           my $pfamily = PVE::Tools::get_host_address_family($nodename);
+           $migrate_port = PVE::Tools::next_migrate_port($pfamily);
+
+           vm_mon_cmd_nocheck($vmid, "nbd-server-start", addr => { type => 'inet', data => { host => "${localip}", port => "${migrate_port}" } } );
+
+           $localip = "[$localip]" if Net::IP::ip_is_ipv6($localip);
 
+           foreach my $opt (sort keys %$local_volumes) {
+               my $volid = $local_volumes->{$opt};
+               vm_mon_cmd_nocheck($vmid, "nbd-server-add", device => "drive-$opt", writable => JSON::true );
+               my $migrate_storage_uri = "nbd:${localip}:${migrate_port}:exportname=drive-$opt";
+               print "storage migration listens on $migrate_storage_uri volume:$volid\n";
+           }
+       }
+
+       if ($migratedfrom) {
            eval {
                set_migration_caps($vmid);
            };
@@ -4596,7 +4758,6 @@ sub vm_start {
            }
 
        } else {
-
            if (!$statefile && (!defined($conf->{balloon}) || $conf->{balloon})) {
                vm_mon_cmd_nocheck($vmid, "balloon", value => $conf->{balloon}*1024*1024)
                    if $conf->{balloon};
@@ -4681,23 +4842,23 @@ sub vm_human_monitor_command {
 sub vm_commandline {
     my ($storecfg, $vmid) = @_;
 
-    my $conf = load_config($vmid);
+    my $conf = PVE::QemuConfig->load_config($vmid);
 
     my $defaults = load_defaults();
 
     my $cmd = config_to_command($storecfg, $vmid, $conf, $defaults);
 
-    return join(' ', @$cmd);
+    return PVE::Tools::cmd2string($cmd);
 }
 
 sub vm_reset {
     my ($vmid, $skiplock) = @_;
 
-    lock_config($vmid, sub {
+    PVE::QemuConfig->lock_config($vmid, sub {
 
-       my $conf = load_config($vmid);
+       my $conf = PVE::QemuConfig->load_config($vmid);
 
-       check_lock($conf) if !$skiplock;
+       PVE::QemuConfig->check_lock($conf) if !$skiplock;
 
        vm_mon_cmd($vmid, "system_reset");
     });
@@ -4708,7 +4869,7 @@ sub get_vm_volumes {
 
     my $vollist = [];
     foreach_volid($conf, sub {
-       my ($volid, $is_cdrom) = @_;
+       my ($volid, $attr) = @_;
 
        return if $volid =~ m|^/|;
 
@@ -4751,20 +4912,20 @@ sub vm_stop {
     if ($migratedfrom){
        my $pid = check_running($vmid, $nocheck, $migratedfrom);
        kill 15, $pid if $pid;
-       my $conf = load_config($vmid, $migratedfrom);
+       my $conf = PVE::QemuConfig->load_config($vmid, $migratedfrom);
        vm_stop_cleanup($storecfg, $vmid, $conf, $keepActive, 0);
        return;
     }
 
-    lock_config($vmid, sub {
+    PVE::QemuConfig->lock_config($vmid, sub {
 
        my $pid = check_running($vmid, $nocheck);
        return if !$pid;
 
        my $conf;
        if (!$nocheck) {
-           $conf = load_config($vmid);
-           check_lock($conf) if !$skiplock;
+           $conf = PVE::QemuConfig->load_config($vmid);
+           PVE::QemuConfig->check_lock($conf) if !$skiplock;
            if (!defined($timeout) && $shutdown && $conf->{startup}) {
                my $opts = PVE::JSONSchema::pve_parse_startup_order($conf->{startup});
                $timeout = $opts->{down} if $opts->{down};
@@ -4835,11 +4996,12 @@ sub vm_stop {
 sub vm_suspend {
     my ($vmid, $skiplock) = @_;
 
-    lock_config($vmid, sub {
+    PVE::QemuConfig->lock_config($vmid, sub {
 
-       my $conf = load_config($vmid);
+       my $conf = PVE::QemuConfig->load_config($vmid);
 
-       check_lock($conf) if !($skiplock || ($conf->{lock} && $conf->{lock} eq 'backup'));
+       PVE::QemuConfig->check_lock($conf)
+           if !($skiplock || PVE::QemuConfig->has_lock($conf, 'backup'));
 
        vm_mon_cmd($vmid, "stop");
     });
@@ -4848,13 +5010,14 @@ sub vm_suspend {
 sub vm_resume {
     my ($vmid, $skiplock, $nocheck) = @_;
 
-    lock_config($vmid, sub {
+    PVE::QemuConfig->lock_config($vmid, sub {
 
        if (!$nocheck) {
 
-           my $conf = load_config($vmid);
+           my $conf = PVE::QemuConfig->load_config($vmid);
 
-           check_lock($conf) if !($skiplock || ($conf->{lock} && $conf->{lock} eq 'backup'));
+           PVE::QemuConfig->check_lock($conf)
+               if !($skiplock || PVE::QemuConfig->has_lock($conf, 'backup'));
 
            vm_mon_cmd($vmid, "cont");
 
@@ -4867,9 +5030,9 @@ sub vm_resume {
 sub vm_sendkey {
     my ($vmid, $skiplock, $key) = @_;
 
-    lock_config($vmid, sub {
+    PVE::QemuConfig->lock_config($vmid, sub {
 
-       my $conf = load_config($vmid);
+       my $conf = PVE::QemuConfig->load_config($vmid);
 
        # there is no qmp command, so we use the human monitor command
        vm_human_monitor_command($vmid, "sendkey $key");
@@ -4879,9 +5042,9 @@ sub vm_sendkey {
 sub vm_destroy {
     my ($storecfg, $vmid, $skiplock) = @_;
 
-    lock_config($vmid, sub {
+    PVE::QemuConfig->lock_config($vmid, sub {
 
-       my $conf = load_config($vmid);
+       my $conf = PVE::QemuConfig->load_config($vmid);
 
        if (!check_running($vmid)) {
            destroy_vm($storecfg, $vmid, undef, $skiplock);
@@ -5008,144 +5171,6 @@ sub pci_dev_group_bind_to_vfio {
     return 1;
 }
 
-sub print_pci_addr {
-    my ($id, $bridges) = @_;
-
-    my $res = '';
-    my $devices = {
-       piix3 => { bus => 0, addr => 1 },
-       #addr2 : first videocard
-       balloon0 => { bus => 0, addr => 3 },
-       watchdog => { bus => 0, addr => 4 },
-       scsihw0 => { bus => 0, addr => 5 },
-       'pci.3' => { bus => 0, addr => 5 }, #can also be used for virtio-scsi-single bridge
-       scsihw1 => { bus => 0, addr => 6 },
-       ahci0 => { bus => 0, addr => 7 },
-       qga0 => { bus => 0, addr => 8 },
-       spice => { bus => 0, addr => 9 },
-       virtio0 => { bus => 0, addr => 10 },
-       virtio1 => { bus => 0, addr => 11 },
-       virtio2 => { bus => 0, addr => 12 },
-       virtio3 => { bus => 0, addr => 13 },
-       virtio4 => { bus => 0, addr => 14 },
-       virtio5 => { bus => 0, addr => 15 },
-       hostpci0 => { bus => 0, addr => 16 },
-       hostpci1 => { bus => 0, addr => 17 },
-       net0 => { bus => 0, addr => 18 },
-       net1 => { bus => 0, addr => 19 },
-       net2 => { bus => 0, addr => 20 },
-       net3 => { bus => 0, addr => 21 },
-       net4 => { bus => 0, addr => 22 },
-       net5 => { bus => 0, addr => 23 },
-       vga1 => { bus => 0, addr => 24 },
-       vga2 => { bus => 0, addr => 25 },
-       vga3 => { bus => 0, addr => 26 },
-       hostpci2 => { bus => 0, addr => 27 },
-       hostpci3 => { bus => 0, addr => 28 },
-       #addr29 : usb-host (pve-usb.cfg)
-       'pci.1' => { bus => 0, addr => 30 },
-       'pci.2' => { bus => 0, addr => 31 },
-       'net6' => { bus => 1, addr => 1 },
-       'net7' => { bus => 1, addr => 2 },
-       'net8' => { bus => 1, addr => 3 },
-       'net9' => { bus => 1, addr => 4 },
-       'net10' => { bus => 1, addr => 5 },
-       'net11' => { bus => 1, addr => 6 },
-       'net12' => { bus => 1, addr => 7 },
-       'net13' => { bus => 1, addr => 8 },
-       'net14' => { bus => 1, addr => 9 },
-       'net15' => { bus => 1, addr => 10 },
-       'net16' => { bus => 1, addr => 11 },
-       'net17' => { bus => 1, addr => 12 },
-       'net18' => { bus => 1, addr => 13 },
-       'net19' => { bus => 1, addr => 14 },
-       'net20' => { bus => 1, addr => 15 },
-       'net21' => { bus => 1, addr => 16 },
-       'net22' => { bus => 1, addr => 17 },
-       'net23' => { bus => 1, addr => 18 },
-       'net24' => { bus => 1, addr => 19 },
-       'net25' => { bus => 1, addr => 20 },
-       'net26' => { bus => 1, addr => 21 },
-       'net27' => { bus => 1, addr => 22 },
-       'net28' => { bus => 1, addr => 23 },
-       'net29' => { bus => 1, addr => 24 },
-       'net30' => { bus => 1, addr => 25 },
-       'net31' => { bus => 1, addr => 26 },
-       'xhci' => { bus => 1, addr => 27 },
-       'virtio6' => { bus => 2, addr => 1 },
-       'virtio7' => { bus => 2, addr => 2 },
-       'virtio8' => { bus => 2, addr => 3 },
-       'virtio9' => { bus => 2, addr => 4 },
-       'virtio10' => { bus => 2, addr => 5 },
-       'virtio11' => { bus => 2, addr => 6 },
-       'virtio12' => { bus => 2, addr => 7 },
-       'virtio13' => { bus => 2, addr => 8 },
-       'virtio14' => { bus => 2, addr => 9 },
-       'virtio15' => { bus => 2, addr => 10 },
-       'virtioscsi0' => { bus => 3, addr => 1 },
-       'virtioscsi1' => { bus => 3, addr => 2 },
-       'virtioscsi2' => { bus => 3, addr => 3 },
-       'virtioscsi3' => { bus => 3, addr => 4 },
-       'virtioscsi4' => { bus => 3, addr => 5 },
-       'virtioscsi5' => { bus => 3, addr => 6 },
-       'virtioscsi6' => { bus => 3, addr => 7 },
-       'virtioscsi7' => { bus => 3, addr => 8 },
-       'virtioscsi8' => { bus => 3, addr => 9 },
-       'virtioscsi9' => { bus => 3, addr => 10 },
-       'virtioscsi10' => { bus => 3, addr => 11 },
-       'virtioscsi11' => { bus => 3, addr => 12 },
-       'virtioscsi12' => { bus => 3, addr => 13 },
-       'virtioscsi13' => { bus => 3, addr => 14 },
-       'virtioscsi14' => { bus => 3, addr => 15 },
-       'virtioscsi15' => { bus => 3, addr => 16 },
-       'virtioscsi16' => { bus => 3, addr => 17 },
-       'virtioscsi17' => { bus => 3, addr => 18 },
-       'virtioscsi18' => { bus => 3, addr => 19 },
-       'virtioscsi19' => { bus => 3, addr => 20 },
-       'virtioscsi20' => { bus => 3, addr => 21 },
-       'virtioscsi21' => { bus => 3, addr => 22 },
-       'virtioscsi22' => { bus => 3, addr => 23 },
-       'virtioscsi23' => { bus => 3, addr => 24 },
-       'virtioscsi24' => { bus => 3, addr => 25 },
-       'virtioscsi25' => { bus => 3, addr => 26 },
-       'virtioscsi26' => { bus => 3, addr => 27 },
-       'virtioscsi27' => { bus => 3, addr => 28 },
-       'virtioscsi28' => { bus => 3, addr => 29 },
-       'virtioscsi29' => { bus => 3, addr => 30 },
-       'virtioscsi30' => { bus => 3, addr => 31 },
-
-    };
-
-    if (defined($devices->{$id}->{bus}) && defined($devices->{$id}->{addr})) {
-          my $addr = sprintf("0x%x", $devices->{$id}->{addr});
-          my $bus = $devices->{$id}->{bus};
-          $res = ",bus=pci.$bus,addr=$addr";
-          $bridges->{$bus} = 1 if $bridges;
-    }
-    return $res;
-
-}
-
-sub print_pcie_addr {
-    my ($id) = @_;
-
-    my $res = '';
-    my $devices = {
-       hostpci0 => { bus => "ich9-pcie-port-1", addr => 0 },
-       hostpci1 => { bus => "ich9-pcie-port-2", addr => 0 },
-       hostpci2 => { bus => "ich9-pcie-port-3", addr => 0 },
-       hostpci3 => { bus => "ich9-pcie-port-4", addr => 0 },
-    };
-
-    if (defined($devices->{$id}->{bus}) && defined($devices->{$id}->{addr})) {
-          my $addr = sprintf("0x%x", $devices->{$id}->{addr});
-          my $bus = $devices->{$id}->{bus};
-          $res = ",bus=$bus,addr=$addr";
-    }
-    return $res;
-
-}
-
 # vzdump restore implementaion
 
 sub tar_archive_read_firstfile {
@@ -5154,11 +5179,11 @@ sub tar_archive_read_firstfile {
     die "ERROR: file '$archive' does not exist\n" if ! -f $archive;
 
     # try to detect archive type first
-    my $pid = open (TMP, "tar tf '$archive'|") ||
+    my $pid = open (my $fh, '-|', 'tar', 'tf', $archive) ||
        die "unable to open file '$archive'\n";
-    my $firstfile = <TMP>;
+    my $firstfile = <$fh>;
     kill 15, $pid;
-    close TMP;
+    close $fh;
 
     die "ERROR: archive contaions no data\n" if !$firstfile;
     chomp $firstfile;
@@ -5236,12 +5261,13 @@ sub restore_update_config_line {
     return if $line =~ m/^parent:/;
     return if $line =~ m/^template:/; # restored VM is never a template
 
+    my $dc = PVE::Cluster::cfs_read_file('datacenter.cfg');
     if (($line =~ m/^(vlan(\d+)):\s*(\S+)\s*$/)) {
        # try to convert old 1.X settings
        my ($id, $ind, $ethcfg) = ($1, $2, $3);
        foreach my $devconfig (PVE::Tools::split_list($ethcfg)) {
            my ($model, $macaddr) = split(/\=/, $devconfig);
-           $macaddr = PVE::Tools::random_ether_addr() if !$macaddr || $unique;
+           $macaddr = PVE::Tools::random_ether_addr($dc->{mac_prefix}) if !$macaddr || $unique;
            my $net = {
                model => $model,
                bridge => "vmbr$ind",
@@ -5255,16 +5281,16 @@ sub restore_update_config_line {
     } elsif (($line =~ m/^(net\d+):\s*(\S+)\s*$/) && $unique) {
        my ($id, $netstr) = ($1, $2);
        my $net = parse_net($netstr);
-       $net->{macaddr} = PVE::Tools::random_ether_addr() if $net->{macaddr};
+       $net->{macaddr} = PVE::Tools::random_ether_addr($dc->{mac_prefix}) if $net->{macaddr};
        $netstr = print_net($net);
        print $outfd "$id: $netstr\n";
-    } elsif ($line =~ m/^((ide|scsi|virtio|sata)\d+):\s*(\S+)\s*$/) {
+    } elsif ($line =~ m/^((ide|scsi|virtio|sata|efidisk)\d+):\s*(\S+)\s*$/) {
        my $virtdev = $1;
        my $value = $3;
-       if ($line =~ m/backup=no/) {
+       my $di = parse_drive($virtdev, $value);
+       if (defined($di->{backup}) && !$di->{backup}) {
            print $outfd "#$line";
-       } elsif ($virtdev && $map->{$virtdev}) {
-           my $di = parse_drive($virtdev, $value);
+       } elsif ($map->{$virtdev}) {
            delete $di->{format}; # format can change on restore
            $di->{file} = $map->{$virtdev};
            $value = print_drive($vmid, $di);
@@ -5304,7 +5330,7 @@ sub is_volume_in_use {
 
        foreach my $key (keys %$cref) {
            my $value = $cref->{$key};
-           if (valid_drivename($key)) {
+           if (is_valid_drivename($key)) {
                next if $skip_drive && $key eq $skip_drive;
                my $drive = parse_drive($key, $value);
                next if !$drive || !$drive->{file} || drive_is_cdrom($drive);
@@ -5340,25 +5366,26 @@ sub update_disksize {
 
     my $changes;
 
-    my $used = {};
+    # used and unused disks
+    my $referenced = {};
 
     # Note: it is allowed to define multiple storages with same path (alias), so
     # we need to check both 'volid' and real 'path' (two different volid can point
     # to the same path).
 
-    my $usedpath = {};
+    my $referencedpath = {};
 
     # update size info
     foreach my $opt (keys %$conf) {
-       if (valid_drivename($opt)) {
+       if (is_valid_drivename($opt)) {
            my $drive = parse_drive($opt, $conf->{$opt});
            my $volid = $drive->{file};
            next if !$volid;
 
-           $used->{$volid} = 1;
+           $referenced->{$volid} = 1;
            if ($volid_hash->{$volid} &&
                (my $path = $volid_hash->{$volid}->{path})) {
-               $usedpath->{$path} = 1;
+               $referencedpath->{$path} = 1;
            }
 
            next if drive_is_cdrom($drive);
@@ -5378,21 +5405,24 @@ sub update_disksize {
        next if $opt !~ m/^unused\d+$/;
        my $volid = $conf->{$opt};
        my $path = $volid_hash->{$volid}->{path} if $volid_hash->{$volid};
-       if ($used->{$volid} || ($path && $usedpath->{$path})) {
+       if ($referenced->{$volid} || ($path && $referencedpath->{$path})) {
            $changes = 1;
            delete $conf->{$opt};
        }
+
+       $referenced->{$volid} = 1;
+       $referencedpath->{$path} = 1 if $path;
     }
 
     foreach my $volid (sort keys %$volid_hash) {
        next if $volid =~ m/vm-$vmid-state-/;
-       next if $used->{$volid};
+       next if $referenced->{$volid};
        my $path = $volid_hash->{$volid}->{path};
        next if !$path; # just to be sure
-       next if $usedpath->{$path};
+       next if $referencedpath->{$path};
        $changes = 1;
-       add_unused_volume($conf, $volid);
-       $usedpath->{$path} = 1; # avoid to add more than once (aliases)
+       PVE::QemuConfig->add_unused_volume($conf, $volid);
+       $referencedpath->{$path} = 1; # avoid to add more than once (aliases)
     }
 
     return $changes;
@@ -5401,16 +5431,16 @@ sub update_disksize {
 sub rescan {
     my ($vmid, $nolock) = @_;
 
-    my $cfg = PVE::Cluster::cfs_read_file("storage.cfg");
+    my $cfg = PVE::Storage::config();
 
     my $volid_hash = scan_volids($cfg, $vmid);
 
     my $updatefn =  sub {
        my ($vmid) = @_;
 
-       my $conf = load_config($vmid);
+       my $conf = PVE::QemuConfig->load_config($vmid);
 
-       check_lock($conf);
+       PVE::QemuConfig->check_lock($conf);
 
        my $vm_volids = {};
        foreach my $volid (keys %$volid_hash) {
@@ -5420,14 +5450,14 @@ sub rescan {
 
        my $changes = update_disksize($vmid, $conf, $vm_volids);
 
-       update_config_nolock($vmid, $conf, 1) if $changes;
+       PVE::QemuConfig->write_config($vmid, $conf) if $changes;
     };
 
     if (defined($vmid)) {
        if ($nolock) {
            &$updatefn($vmid);
        } else {
-           lock_config($vmid, $updatefn, $vmid);
+           PVE::QemuConfig->lock_config($vmid, $updatefn, $vmid);
        }
     } else {
        my $vmlist = config_list();
@@ -5435,7 +5465,7 @@ sub rescan {
            if ($nolock) {
                &$updatefn($vmid);
            } else {
-               lock_config($vmid, $updatefn, $vmid);
+               PVE::QemuConfig->lock_config($vmid, $updatefn, $vmid);
            }
        }
     }
@@ -5465,9 +5495,10 @@ sub restore_vma_archive {
     rmtree $tmpdir;
 
     # disable interrupts (always do cleanups)
-    local $SIG{INT} = $SIG{TERM} = $SIG{QUIT} = $SIG{HUP} = sub {
-       warn "got interrupt - ignored\n";
-    };
+    local $SIG{INT} =
+       local $SIG{TERM} =
+       local $SIG{QUIT} =
+       local $SIG{HUP} = sub { warn "got interrupt - ignored\n"; };
 
     my $mapfifo = "/var/tmp/vzdumptmp$$.fifo";
     POSIX::mkfifo($mapfifo, 0600);
@@ -5486,11 +5517,12 @@ sub restore_vma_archive {
 
     my $rpcenv = PVE::RPCEnvironment::get();
 
-    my $conffile = config_file($vmid);
+    my $conffile = PVE::QemuConfig->config_file($vmid);
     my $tmpfn = "$conffile.$$.tmp";
 
     # Note: $oldconf is undef if VM does not exists
-    my $oldconf = PVE::Cluster::cfs_read_file(cfs_config_path($vmid));
+    my $cfs_path = PVE::QemuConfig->cfs_config_path($vmid);
+    my $oldconf = PVE::Cluster::cfs_read_file($cfs_path);
 
     my $print_devmap = sub {
        my $virtdev_hash = {};
@@ -5539,7 +5571,7 @@ sub restore_vma_archive {
                if !$devinfo->{$devname}->{virtdev};
        }
 
-       my $cfg = cfs_read_file('storage.cfg');
+       my $cfg = PVE::Storage::config();
 
        # create empty/temp config
        if ($oldconf) {
@@ -5559,9 +5591,24 @@ sub restore_vma_archive {
                # Note: only delete disk we want to restore
                # other volumes will become unused
                if ($virtdev_hash->{$ds}) {
-                   PVE::Storage::vdisk_free($cfg, $volid);
+                   eval { PVE::Storage::vdisk_free($cfg, $volid); };
+                   if (my $err = $@) {
+                       warn $err;
+                   }
                }
            });
+
+           # delete vmstate files
+           # since after the restore we have no snapshots anymore
+           foreach my $snapname (keys %{$oldconf->{snapshots}}) {
+               my $snap = $oldconf->{snapshots}->{$snapname};
+               if ($snap->{vmstate}) {
+                   eval { PVE::Storage::vdisk_free($cfg, $snap->{vmstate}); };
+                   if (my $err = $@) {
+                       warn $err;
+                   }
+               }
+           }
        }
 
        my $map = {};
@@ -5584,13 +5631,11 @@ sub restore_vma_archive {
            PVE::Storage::activate_volumes($cfg,[$volid]);
 
            my $write_zeros = 1;
-           # fixme: what other storages types initialize volumes with zero?
-           if ($scfg->{type} eq 'dir' || $scfg->{type} eq 'nfs' || $scfg->{type} eq 'glusterfs' ||
-               $scfg->{type} eq 'sheepdog' || $scfg->{type} eq 'rbd') {
+           if (PVE::Storage::volume_has_feature($cfg, 'sparseinit', $volid)) {
                $write_zeros = 0;
            }
 
-           print $fifofh "${write_zeros}:$d->{devname}=$path\n";
+           print $fifofh "format=$d->{format}:${write_zeros}:$d->{devname}=$path\n";
 
            print "map '$d->{devname}' to '$path' (write zeros = ${write_zeros})\n";
            $map->{$virtdev} = $volid;
@@ -5612,9 +5657,11 @@ sub restore_vma_archive {
 
     eval {
        # enable interrupts
-       local $SIG{INT} = $SIG{TERM} = $SIG{QUIT} = $SIG{HUP} = $SIG{PIPE} = sub {
-           die "interrupted by signal\n";
-       };
+       local $SIG{INT} =
+           local $SIG{TERM} =
+           local $SIG{QUIT} =
+           local $SIG{HUP} =
+           local $SIG{PIPE} = sub { die "interrupted by signal\n"; };
        local $SIG{ALRM} = sub { die "got timeout\n"; };
 
        $oldtimeout = alarm($timeout);
@@ -5654,7 +5701,7 @@ sub restore_vma_archive {
        push @$vollist, $volid if $volid;
     }
 
-    my $cfg = cfs_read_file('storage.cfg');
+    my $cfg = PVE::Storage::config();
     PVE::Storage::deactivate_volumes($cfg, $vollist);
 
     unlink $mapfifo;
@@ -5699,10 +5746,10 @@ sub restore_tar_archive {
            if $firstfile ne 'qemu-server.conf';
     }
 
-    my $storecfg = cfs_read_file('storage.cfg');
+    my $storecfg = PVE::Storage::config();
 
     # destroy existing data - keep empty config
-    my $vmcfgfn = config_file($vmid);
+    my $vmcfgfn = PVE::QemuConfig->config_file($vmid);
     destroy_vm($storecfg, $vmid, 1) if -f $vmcfgfn;
 
     my $tocmd = "/usr/lib/qemu-server/qmextract";
@@ -5724,19 +5771,22 @@ sub restore_tar_archive {
     local $ENV{VZDUMP_VMID} = $vmid;
     local $ENV{VZDUMP_USER} = $user;
 
-    my $conffile = config_file($vmid);
+    my $conffile = PVE::QemuConfig->config_file($vmid);
     my $tmpfn = "$conffile.$$.tmp";
 
     # disable interrupts (always do cleanups)
-    local $SIG{INT} = $SIG{TERM} = $SIG{QUIT} = $SIG{HUP} = sub {
-       print STDERR "got interrupt - ignored\n";
-    };
+    local $SIG{INT} =
+       local $SIG{TERM} =
+       local $SIG{QUIT} =
+       local $SIG{HUP} = sub { print STDERR "got interrupt - ignored\n"; };
 
     eval {
        # enable interrupts
-       local $SIG{INT} = $SIG{TERM} = $SIG{QUIT} = $SIG{HUP} = $SIG{PIPE} = sub {
-           die "interrupted by signal\n";
-       };
+       local $SIG{INT} =
+           local $SIG{TERM} =
+           local $SIG{QUIT} =
+           local $SIG{HUP} =
+           local $SIG{PIPE} = sub { die "interrupted by signal\n"; };
 
        if ($archive eq '-') {
            print "extracting archive from STDIN\n";
@@ -5800,693 +5850,350 @@ sub restore_tar_archive {
     warn $@ if $@;
 };
 
-
-# Internal snapshots
-
-# NOTE: Snapshot create/delete involves several non-atomic
-# action, and can take a long time.
-# So we try to avoid locking the file and use 'lock' variable
-# inside the config file instead.
-
-my $snapshot_copy_config = sub {
-    my ($source, $dest) = @_;
-
-    foreach my $k (keys %$source) {
-       next if $k eq 'snapshots';
-       next if $k eq 'snapstate';
-       next if $k eq 'snaptime';
-       next if $k eq 'vmstate';
-       next if $k eq 'lock';
-       next if $k eq 'digest';
-       next if $k eq 'description';
-       next if $k =~ m/^unused\d+$/;
-
-       $dest->{$k} = $source->{$k};
-    }
-};
-
-my $snapshot_apply_config = sub {
-    my ($conf, $snap) = @_;
-
-    # copy snapshot list
-    my $newconf = {
-       snapshots => $conf->{snapshots},
-    };
-
-    # keep description and list of unused disks
-    foreach my $k (keys %$conf) {
-       next if !($k =~ m/^unused\d+$/ || $k eq 'description');
-       $newconf->{$k} = $conf->{$k};
-    }
-
-    &$snapshot_copy_config($snap, $newconf);
-
-    return $newconf;
-};
-
-sub foreach_writable_storage {
+sub foreach_storage_used_by_vm {
     my ($conf, $func) = @_;
 
     my $sidhash = {};
 
-    foreach my $ds (keys %$conf) {
-       next if !valid_drivename($ds);
-
-       my $drive = parse_drive($ds, $conf->{$ds});
-       next if !$drive;
-       next if drive_is_cdrom($drive);
+    foreach_drive($conf, sub {
+       my ($ds, $drive) = @_;
+       return if drive_is_cdrom($drive);
 
        my $volid = $drive->{file};
 
        my ($sid, $volname) = PVE::Storage::parse_volume_id($volid, 1);
        $sidhash->{$sid} = $sid if $sid;
-    }
+    });
 
     foreach my $sid (sort keys %$sidhash) {
        &$func($sid);
     }
 }
 
-my $alloc_vmstate_volid = sub {
-    my ($storecfg, $vmid, $conf, $snapname) = @_;
+sub do_snapshots_with_qemu {
+    my ($storecfg, $volid) = @_;
 
-    # Note: we try to be smart when selecting a $target storage
+    my $storage_name = PVE::Storage::parse_volume_id($volid);
 
-    my $target;
+    if ($qemu_snap_storage->{$storecfg->{ids}->{$storage_name}->{type}} 
+       && !$storecfg->{ids}->{$storage_name}->{krbd}){
+       return 1;
+    }
 
-    # search shared storage first
-    foreach_writable_storage($conf, sub {
-       my ($sid) = @_;
-       my $scfg = PVE::Storage::storage_config($storecfg, $sid);
-       return if !$scfg->{shared};
+    if ($volid =~ m/\.(qcow2|qed)$/){
+       return 1;
+    }
 
-       $target = $sid if !$target || $scfg->{path}; # prefer file based storage
-    });
+    return undef;
+}
 
-    if (!$target) {
-       # now search local storage
-       foreach_writable_storage($conf, sub {
-           my ($sid) = @_;
-           my $scfg = PVE::Storage::storage_config($storecfg, $sid);
-           return if $scfg->{shared};
+sub qga_check_running {
+    my ($vmid) = @_;
 
-           $target = $sid if !$target || $scfg->{path}; # prefer file based storage;
-       });
+    eval { vm_mon_cmd($vmid, "guest-ping", timeout => 3); };
+    if ($@) {
+       warn "Qemu Guest Agent is not running - $@";
+       return 0;
     }
+    return 1;
+}
 
-    $target = 'local' if !$target;
-
-    my $driver_state_size = 500; # assume 32MB is enough to safe all driver state;
-    # we abort live save after $conf->{memory}, so we need at max twice that space
-    my $size = $conf->{memory}*2 + $driver_state_size;
+sub template_create {
+    my ($vmid, $conf, $disk) = @_;
 
-    my $name = "vm-$vmid-state-$snapname";
-    my $scfg = PVE::Storage::storage_config($storecfg, $target);
-    $name .= ".raw" if $scfg->{path}; # add filename extension for file base storage
-    my $volid = PVE::Storage::vdisk_alloc($storecfg, $target, $vmid, 'raw', $name, $size*1024);
+    my $storecfg = PVE::Storage::config();
 
-    return $volid;
-};
+    foreach_drive($conf, sub {
+       my ($ds, $drive) = @_;
 
-my $snapshot_prepare = sub {
-    my ($vmid, $snapname, $save_vmstate, $comment) = @_;
+       return if drive_is_cdrom($drive);
+       return if $disk && $ds ne $disk;
 
-    my $snap;
+       my $volid = $drive->{file};
+       return if !PVE::Storage::volume_has_feature($storecfg, 'template', $volid);
 
-    my $updatefn =  sub {
+       my $voliddst = PVE::Storage::vdisk_create_base($storecfg, $volid);
+       $drive->{file} = $voliddst;
+       $conf->{$ds} = print_drive($vmid, $drive);
+       PVE::QemuConfig->write_config($vmid, $conf);
+    });
+}
 
-       my $conf = load_config($vmid);
+sub qemu_img_convert {
+    my ($src_volid, $dst_volid, $size, $snapname, $is_zero_initialized) = @_;
 
-       die "you can't take a snapshot if it's a template\n"
-           if is_template($conf);
+    my $storecfg = PVE::Storage::config();
+    my ($src_storeid, $src_volname) = PVE::Storage::parse_volume_id($src_volid, 1);
+    my ($dst_storeid, $dst_volname) = PVE::Storage::parse_volume_id($dst_volid, 1);
 
-       check_lock($conf);
+    if ($src_storeid && $dst_storeid) {
 
-       $conf->{lock} = 'snapshot';
+       PVE::Storage::activate_volumes($storecfg, [$src_volid], $snapname);
 
-       die "snapshot name '$snapname' already used\n"
-           if defined($conf->{snapshots}->{$snapname});
+       my $src_scfg = PVE::Storage::storage_config($storecfg, $src_storeid);
+       my $dst_scfg = PVE::Storage::storage_config($storecfg, $dst_storeid);
 
-       my $storecfg = PVE::Storage::config();
-       die "snapshot feature is not available" if !has_feature('snapshot', $conf, $storecfg);
+       my $src_format = qemu_img_format($src_scfg, $src_volname);
+       my $dst_format = qemu_img_format($dst_scfg, $dst_volname);
 
-       $snap = $conf->{snapshots}->{$snapname} = {};
+       my $src_path = PVE::Storage::path($storecfg, $src_volid, $snapname);
+       my $dst_path = PVE::Storage::path($storecfg, $dst_volid);
 
-       if ($save_vmstate && check_running($vmid)) {
-           $snap->{vmstate} = &$alloc_vmstate_volid($storecfg, $vmid, $conf, $snapname);
+       my $cmd = [];
+       push @$cmd, '/usr/bin/qemu-img', 'convert', '-p', '-n';
+       push @$cmd, '-s', $snapname if($snapname && $src_format eq "qcow2");
+       push @$cmd, '-f', $src_format, '-O', $dst_format, $src_path;
+       if ($is_zero_initialized) {
+           push @$cmd, "zeroinit:$dst_path";
+       } else {
+           push @$cmd, $dst_path;
        }
 
-       &$snapshot_copy_config($conf, $snap);
+       my $parser = sub {
+           my $line = shift;
+           if($line =~ m/\((\S+)\/100\%\)/){
+               my $percent = $1;
+               my $transferred = int($size * $percent / 100);
+               my $remaining = $size - $transferred;
 
-       $snap->{snapstate} = "prepare";
-       $snap->{snaptime} = time();
-       $snap->{description} = $comment if $comment;
+               print "transferred: $transferred bytes remaining: $remaining bytes total: $size bytes progression: $percent %\n";
+           }
 
-       # always overwrite machine if we save vmstate. This makes sure we
-       # can restore it later using correct machine type
-       $snap->{machine} = get_current_qemu_machine($vmid) if $snap->{vmstate};
+       };
 
-       update_config_nolock($vmid, $conf, 1);
-    };
+       eval  { run_command($cmd, timeout => undef, outfunc => $parser); };
+       my $err = $@;
+       die "copy failed: $err" if $err;
+    }
+}
 
-    lock_config($vmid, $updatefn);
+sub qemu_img_format {
+    my ($scfg, $volname) = @_;
 
-    return $snap;
-};
+    if ($scfg->{path} && $volname =~ m/\.(raw|cow|qcow|qcow2|qed|vmdk|cloop)$/) {
+       return $1;
+    } else {
+       return "raw";
+    }
+}
 
-my $snapshot_commit = sub {
-    my ($vmid, $snapname) = @_;
+sub qemu_drive_mirror {
+    my ($vmid, $drive, $dst_volid, $vmiddst, $is_zero_initialized, $jobs, $skipcomplete, $qga) = @_;
 
-    my $updatefn = sub {
+    $jobs = {} if !$jobs;
 
-       my $conf = load_config($vmid);
+    my $qemu_target;
+    my $format;
+    $jobs->{"drive-$drive"} = {};
+
+    if ($dst_volid =~ /^nbd:(localhost|[\d\.]+|\[[\d\.:a-fA-F]+\]):(\d+):exportname=(\S+)/) {
+       my $server = $1;
+       my $port = $2;
+       my $exportname = $3;
+
+       $format = "nbd";
+       my $unixsocket = "/run/qemu-server/$vmid.mirror-drive-$drive";
+       $qemu_target = "nbd+unix:///$exportname?socket=$unixsocket";
+       my $cmd = ['socat', '-T30', "UNIX-LISTEN:$unixsocket,fork", "TCP:$server:$2,connect-timeout=5"];
+
+       my $pid = fork();
+       if (!defined($pid)) {
+           die "forking socat tunnel failed\n";
+       } elsif ($pid == 0) {
+           exec(@$cmd);
+           warn "exec failed: $!\n";
+           POSIX::_exit(-1);
+       }
+       $jobs->{"drive-$drive"}->{pid} = $pid;
+
+       my $timeout = 0;
+       while (!-S $unixsocket) {
+           die "nbd connection helper timed out\n"
+               if $timeout++ > 5;
+           sleep 1;
+       }
+    } else {
+       my $storecfg = PVE::Storage::config();
+       my ($dst_storeid, $dst_volname) = PVE::Storage::parse_volume_id($dst_volid);
 
-       die "missing snapshot lock\n"
-           if !($conf->{lock} && $conf->{lock} eq 'snapshot');
+       my $dst_scfg = PVE::Storage::storage_config($storecfg, $dst_storeid);
 
-       my $has_machine_config = defined($conf->{machine});
+       $format = qemu_img_format($dst_scfg, $dst_volname);
 
-       my $snap = $conf->{snapshots}->{$snapname};
+       my $dst_path = PVE::Storage::path($storecfg, $dst_volid);
 
-       die "snapshot '$snapname' does not exist\n" if !defined($snap);
-
-       die "wrong snapshot state\n"
-           if !($snap->{snapstate} && $snap->{snapstate} eq "prepare");
-
-       delete $snap->{snapstate};
-       delete $conf->{lock};
-
-       my $newconf = &$snapshot_apply_config($conf, $snap);
-
-       delete $newconf->{machine} if !$has_machine_config;
-
-       $newconf->{parent} = $snapname;
-
-       update_config_nolock($vmid, $newconf, 1);
-    };
-
-    lock_config($vmid, $updatefn);
-};
-
-sub snapshot_rollback {
-    my ($vmid, $snapname) = @_;
-
-    my $prepare = 1;
-
-    my $storecfg = PVE::Storage::config();
-
-    my $conf = load_config($vmid);
-
-    my $get_snapshot_config = sub {
-
-       die "you can't rollback if vm is a template\n" if is_template($conf);
-
-       my $res = $conf->{snapshots}->{$snapname};
-
-       die "snapshot '$snapname' does not exist\n" if !defined($res);
-
-       return $res;
-    };
-
-    my $snap = &$get_snapshot_config();
-
-    foreach_drive($snap, sub {
-       my ($ds, $drive) = @_;
-
-       return if drive_is_cdrom($drive);
-
-       my $volid = $drive->{file};
-
-       PVE::Storage::volume_rollback_is_possible($storecfg, $volid, $snapname);
-    });
-
-    my $updatefn = sub {
-
-       $conf = load_config($vmid);
-
-       $snap = &$get_snapshot_config();
-
-       die "unable to rollback to incomplete snapshot (snapstate = $snap->{snapstate})\n"
-           if $snap->{snapstate};
-
-       if ($prepare) {
-           check_lock($conf);
-           vm_stop($storecfg, $vmid, undef, undef, 5, undef, undef);
-       }
-
-       die "unable to rollback vm $vmid: vm is running\n"
-           if check_running($vmid);
-
-       if ($prepare) {
-           $conf->{lock} = 'rollback';
-       } else {
-           die "got wrong lock\n" if !($conf->{lock} && $conf->{lock} eq 'rollback');
-           delete $conf->{lock};
-       }
-
-       my $forcemachine;
-
-       if (!$prepare) {
-           my $has_machine_config = defined($conf->{machine});
-
-           # copy snapshot config to current config
-           $conf = &$snapshot_apply_config($conf, $snap);
-           $conf->{parent} = $snapname;
-
-           # Note: old code did not store 'machine', so we try to be smart
-           # and guess the snapshot was generated with kvm 1.4 (pc-i440fx-1.4).
-           $forcemachine = $conf->{machine} || 'pc-i440fx-1.4';
-           # we remove the 'machine' configuration if not explicitly specified
-           # in the original config.
-           delete $conf->{machine} if $snap->{vmstate} && !$has_machine_config;
-       }
-
-       update_config_nolock($vmid, $conf, 1);
-
-       if (!$prepare && $snap->{vmstate}) {
-           my $statefile = PVE::Storage::path($storecfg, $snap->{vmstate});
-           vm_start($storecfg, $vmid, $statefile, undef, undef, undef, $forcemachine);
-       }
-    };
-
-    lock_config($vmid, $updatefn);
-
-    foreach_drive($snap, sub {
-       my ($ds, $drive) = @_;
-
-       return if drive_is_cdrom($drive);
-
-       my $volid = $drive->{file};
-       my $device = "drive-$ds";
-
-       PVE::Storage::volume_snapshot_rollback($storecfg, $volid, $snapname);
-    });
-
-    $prepare = 0;
-    lock_config($vmid, $updatefn);
-}
-
-my $savevm_wait = sub {
-    my ($vmid) = @_;
-
-    for(;;) {
-       my $stat = vm_mon_cmd_nocheck($vmid, "query-savevm");
-       if (!$stat->{status}) {
-           die "savevm not active\n";
-       } elsif ($stat->{status} eq 'active') {
-           sleep(1);
-           next;
-       } elsif ($stat->{status} eq 'completed') {
-           last;
-       } else {
-           die "query-savevm returned status '$stat->{status}'\n";
-       }
+       $qemu_target = $is_zero_initialized ? "zeroinit:$dst_path" : $dst_path;
     }
-};
 
-sub do_snapshots_with_qemu {
-    my ($storecfg, $volid) = @_;
+    my $opts = { timeout => 10, device => "drive-$drive", mode => "existing", sync => "full", target => $qemu_target };
+    $opts->{format} = $format if $format;
 
-    my $storage_name = PVE::Storage::parse_volume_id($volid);
+    print "drive mirror is starting for drive-$drive\n";
 
-    if ($qemu_snap_storage->{$storecfg->{ids}->{$storage_name}->{type}} 
-       && !$storecfg->{ids}->{$storage_name}->{krbd}){
-       return 1;
-    }
+    eval { vm_mon_cmd($vmid, "drive-mirror", %$opts); }; #if a job already run for this device,it's throw an error
 
-    if ($volid =~ m/\.(qcow2|qed)$/){
-       return 1;
+    if (my $err = $@) {
+       eval { PVE::QemuServer::qemu_blockjobs_cancel($vmid, $jobs) };
+       die "mirroring error: $err";
     }
 
-    return undef;
+    qemu_drive_mirror_monitor ($vmid, $vmiddst, $jobs, $skipcomplete, $qga);
 }
 
-sub snapshot_create {
-    my ($vmid, $snapname, $save_vmstate, $comment) = @_;
-
-    my $snap = &$snapshot_prepare($vmid, $snapname, $save_vmstate, $comment);
-
-    $save_vmstate = 0 if !$snap->{vmstate}; # vm is not running
-
-    my $config = load_config($vmid);
-
-    my $running = check_running($vmid);
-
-    my $freezefs = $running && $config->{agent};
-    $freezefs = 0 if $snap->{vmstate}; # not needed if we save RAM
-
-    my $drivehash = {};
-
-    if ($freezefs) {
-       eval { vm_mon_cmd($vmid, "guest-fsfreeze-freeze"); };
-       warn "guest-fsfreeze-freeze problems - $@" if $@;
-    }
+sub qemu_drive_mirror_monitor {
+    my ($vmid, $vmiddst, $jobs, $skipcomplete, $qga) = @_;
 
     eval {
-       # create internal snapshots of all drives
-
-       my $storecfg = PVE::Storage::config();
-
-       if ($running) {
-           if ($snap->{vmstate}) {
-               my $path = PVE::Storage::path($storecfg, $snap->{vmstate});
-               vm_mon_cmd($vmid, "savevm-start", statefile => $path);
-               &$savevm_wait($vmid);
-           } else {
-               vm_mon_cmd($vmid, "savevm-start");
-           }
-       };
-
-       foreach_drive($snap, sub {
-           my ($ds, $drive) = @_;
+       my $err_complete = 0;
 
-           return if drive_is_cdrom($drive);
-
-           my $volid = $drive->{file};
-           my $device = "drive-$ds";
-
-           qemu_volume_snapshot($vmid, $device, $storecfg, $volid, $snapname);
-           $drivehash->{$ds} = 1;
-       });
-    };
-    my $err = $@;
-
-    if ($running) {
-       eval { vm_mon_cmd($vmid, "savevm-end")  };
-       warn $@ if $@;
+       while (1) {
+           die "storage migration timed out\n" if $err_complete > 300;
 
-       if ($freezefs) {
-           eval { vm_mon_cmd($vmid, "guest-fsfreeze-thaw"); };
-           warn "guest-fsfreeze-thaw problems - $@" if $@;
-       }
+           my $stats = vm_mon_cmd($vmid, "query-block-jobs");
 
-       # savevm-end is async, we need to wait
-       for (;;) {
-           my $stat = vm_mon_cmd_nocheck($vmid, "query-savevm");
-           if (!$stat->{bytes}) {
-               last;
-           } else {
-               print "savevm not yet finished\n";
-               sleep(1);
-               next;
+           my $running_mirror_jobs = {};
+           foreach my $stat (@$stats) {
+               next if $stat->{type} ne 'mirror';
+               $running_mirror_jobs->{$stat->{device}} = $stat;
            }
-       }
-    }
 
-    if ($err) {
-       warn "snapshot create failed: starting cleanup\n";
-       eval { snapshot_delete($vmid, $snapname, 0, $drivehash); };
-       warn $@ if $@;
-       die $err;
-    }
+           my $readycounter = 0;
 
-    &$snapshot_commit($vmid, $snapname);
-}
+           foreach my $job (keys %$jobs) {
 
-# Note: $drivehash is only set when called from snapshot_create.
-sub snapshot_delete {
-    my ($vmid, $snapname, $force, $drivehash) = @_;
+               if(defined($jobs->{$job}->{complete}) && !defined($running_mirror_jobs->{$job})) {
+                   print "$job : finished\n";
+                   delete $jobs->{$job};
+                   next;
+               }
 
-    my $prepare = 1;
+               die "$job: mirroring has been cancelled\n" if !defined($running_mirror_jobs->{$job});
 
-    my $snap;
-    my $unused = [];
+               my $busy = $running_mirror_jobs->{$job}->{busy};
+               my $ready = $running_mirror_jobs->{$job}->{ready};
+               if (my $total = $running_mirror_jobs->{$job}->{len}) {
+                   my $transferred = $running_mirror_jobs->{$job}->{offset} || 0;
+                   my $remaining = $total - $transferred;
+                   my $percent = sprintf "%.2f", ($transferred * 100 / $total);
 
-    my $unlink_parent = sub {
-       my ($confref, $new_parent) = @_;
+                   print "$job: transferred: $transferred bytes remaining: $remaining bytes total: $total bytes progression: $percent % busy: $busy ready: $ready \n";
+               }
 
-       if ($confref->{parent} && $confref->{parent} eq $snapname) {
-           if ($new_parent) {
-               $confref->{parent} = $new_parent;
-           } else {
-               delete $confref->{parent};
+               $readycounter++ if $running_mirror_jobs->{$job}->{ready};
            }
-       }
-    };
-
-    my $updatefn =  sub {
-       my ($remove_drive) = @_;
 
-       my $conf = load_config($vmid);
+           last if scalar(keys %$jobs) == 0;
 
-       if (!$drivehash) {
-           check_lock($conf);
-           die "you can't delete a snapshot if vm is a template\n"
-               if is_template($conf);
-       }
+           if ($readycounter == scalar(keys %$jobs)) {
+               print "all mirroring jobs are ready \n";
+               last if $skipcomplete; #do the complete later
 
-       $snap = $conf->{snapshots}->{$snapname};
+               if ($vmiddst && $vmiddst != $vmid) {
+                   my $agent_running = $qga && qga_check_running($vmid);
+                   if ($agent_running) {
+                       print "freeze filesystem\n";
+                       eval { PVE::QemuServer::vm_mon_cmd($vmid, "guest-fsfreeze-freeze"); };
+                   } else {
+                       print "suspend vm\n";
+                       eval { PVE::QemuServer::vm_suspend($vmid, 1); };
+                   }
 
-       die "snapshot '$snapname' does not exist\n" if !defined($snap);
+                   # if we clone a disk for a new target vm, we don't switch the disk
+                   PVE::QemuServer::qemu_blockjobs_cancel($vmid, $jobs);
 
-       # remove parent refs
-       if (!$prepare) {
-           &$unlink_parent($conf, $snap->{parent});
-           foreach my $sn (keys %{$conf->{snapshots}}) {
-               next if $sn eq $snapname;
-               &$unlink_parent($conf->{snapshots}->{$sn}, $snap->{parent});
-           }
-       }
+                   if ($agent_running) {
+                       print "unfreeze filesystem\n";
+                       eval { PVE::QemuServer::vm_mon_cmd($vmid, "guest-fsfreeze-thaw"); };
+                   } else {
+                       print "resume vm\n";
+                       eval {  PVE::QemuServer::vm_resume($vmid, 1, 1); };
+                   }
 
-       if ($remove_drive) {
-           if ($remove_drive eq 'vmstate') {
-               delete $snap->{$remove_drive};
-           } else {
-               my $drive = parse_drive($remove_drive, $snap->{$remove_drive});
-               my $volid = $drive->{file};
-               delete $snap->{$remove_drive};
-               add_unused_volume($conf, $volid);
-           }
-       }
+                   last;
+               } else {
 
-       if ($prepare) {
-           $snap->{snapstate} = 'delete';
-       } else {
-           delete $conf->{snapshots}->{$snapname};
-           delete $conf->{lock} if $drivehash;
-           foreach my $volid (@$unused) {
-               add_unused_volume($conf, $volid);
+                   foreach my $job (keys %$jobs) {
+                       # try to switch the disk if source and destination are on the same guest
+                       print "$job: Completing block job...\n";
+
+                       eval { vm_mon_cmd($vmid, "block-job-complete", device => $job) };
+                       if ($@ =~ m/cannot be completed/) {
+                           print "$job: Block job cannot be completed, try again.\n";
+                           $err_complete++;
+                       }else {
+                           print "$job: Completed successfully.\n";
+                           $jobs->{$job}->{complete} = 1;
+                           eval { qemu_blockjobs_finish_tunnel($vmid, $job, $jobs->{$job}->{pid}) } ;
+                       }
+                   }
+               }
            }
+           sleep 1;
        }
-
-       update_config_nolock($vmid, $conf, 1);
-    };
-
-    lock_config($vmid, $updatefn);
-
-    # now remove vmstate file
-
-    my $storecfg = PVE::Storage::config();
-
-    if ($snap->{vmstate}) {
-       eval {  PVE::Storage::vdisk_free($storecfg, $snap->{vmstate}); };
-       if (my $err = $@) {
-           die $err if !$force;
-           warn $err;
-       }
-       # save changes (remove vmstate from snapshot)
-       lock_config($vmid, $updatefn, 'vmstate') if !$force;
     };
+    my $err = $@;
 
-    # now remove all internal snapshots
-    foreach_drive($snap, sub {
-       my ($ds, $drive) = @_;
-
-       return if drive_is_cdrom($drive);
-
-       my $volid = $drive->{file};
-       my $device = "drive-$ds";
-
-       if (!$drivehash || $drivehash->{$ds}) {
-           eval { qemu_volume_snapshot_delete($vmid, $device, $storecfg, $volid, $snapname); };
-           if (my $err = $@) {
-               die $err if !$force;
-               warn $err;
-           }
-       }
-
-       # save changes (remove drive fron snapshot)
-       lock_config($vmid, $updatefn, $ds) if !$force;
-       push @$unused, $volid;
-    });
-
-    # now cleanup config
-    $prepare = 0;
-    lock_config($vmid, $updatefn);
-}
-
-sub has_feature {
-    my ($feature, $conf, $storecfg, $snapname, $running) = @_;
-
-    my $err;
-    foreach_drive($conf, sub {
-       my ($ds, $drive) = @_;
-
-       return if drive_is_cdrom($drive);
-       my $volid = $drive->{file};
-       $err = 1 if !PVE::Storage::volume_has_feature($storecfg, $feature, $volid, $snapname, $running);
-    });
-
-    return $err ? 0 : 1;
-}
-
-sub template_create {
-    my ($vmid, $conf, $disk) = @_;
-
-    my $storecfg = PVE::Storage::config();
-
-    foreach_drive($conf, sub {
-       my ($ds, $drive) = @_;
-
-       return if drive_is_cdrom($drive);
-       return if $disk && $ds ne $disk;
-
-       my $volid = $drive->{file};
-       return if !PVE::Storage::volume_has_feature($storecfg, 'template', $volid);
-
-       my $voliddst = PVE::Storage::vdisk_create_base($storecfg, $volid);
-       $drive->{file} = $voliddst;
-       $conf->{$ds} = print_drive($vmid, $drive);
-       update_config_nolock($vmid, $conf, 1);
-    });
-}
-
-sub is_template {
-    my ($conf) = @_;
+    if ($err) {
+       eval { PVE::QemuServer::qemu_blockjobs_cancel($vmid, $jobs) };
+       die "mirroring error: $err";
+    }
 
-    return 1 if defined $conf->{template} && $conf->{template} == 1;
 }
 
-sub qemu_img_convert {
-    my ($src_volid, $dst_volid, $size, $snapname) = @_;
+sub qemu_blockjobs_cancel {
+    my ($vmid, $jobs) = @_;
 
-    my $storecfg = PVE::Storage::config();
-    my ($src_storeid, $src_volname) = PVE::Storage::parse_volume_id($src_volid, 1);
-    my ($dst_storeid, $dst_volname) = PVE::Storage::parse_volume_id($dst_volid, 1);
-
-    if ($src_storeid && $dst_storeid) {
-
-       PVE::Storage::activate_volumes($storecfg, [$src_volid], $snapname);
-
-       my $src_scfg = PVE::Storage::storage_config($storecfg, $src_storeid);
-       my $dst_scfg = PVE::Storage::storage_config($storecfg, $dst_storeid);
-
-       my $src_format = qemu_img_format($src_scfg, $src_volname);
-       my $dst_format = qemu_img_format($dst_scfg, $dst_volname);
+    foreach my $job (keys %$jobs) {
+       print "$job: Cancelling block job\n";
+       eval { vm_mon_cmd($vmid, "block-job-cancel", device => $job); };
+       $jobs->{$job}->{cancel} = 1;
+    }
 
-       my $src_path = PVE::Storage::path($storecfg, $src_volid, $snapname);
-       my $dst_path = PVE::Storage::path($storecfg, $dst_volid);
+    while (1) {
+       my $stats = vm_mon_cmd($vmid, "query-block-jobs");
 
-       my $cmd = [];
-       push @$cmd, '/usr/bin/qemu-img', 'convert', '-t', 'writeback', '-p', '-n';
-       push @$cmd, '-s', $snapname if($snapname && $src_format eq "qcow2");
-       push @$cmd, '-f', $src_format, '-O', $dst_format, $src_path, $dst_path;
+       my $running_jobs = {};
+       foreach my $stat (@$stats) {
+           $running_jobs->{$stat->{device}} = $stat;
+       }
 
-       my $parser = sub {
-           my $line = shift;
-           if($line =~ m/\((\S+)\/100\%\)/){
-               my $percent = $1;
-               my $transferred = int($size * $percent / 100);
-               my $remaining = $size - $transferred;
+       foreach my $job (keys %$jobs) {
 
-               print "transferred: $transferred bytes remaining: $remaining bytes total: $size bytes progression: $percent %\n";
+           if (defined($jobs->{$job}->{cancel}) && !defined($running_jobs->{$job})) {
+               print "$job: Done.\n";
+               eval { qemu_blockjobs_finish_tunnel($vmid, $job, $jobs->{$job}->{pid}) } ;
+               delete $jobs->{$job};
            }
+       }
 
-       };
+       last if scalar(keys %$jobs) == 0;
 
-       eval  { run_command($cmd, timeout => undef, outfunc => $parser); };
-       my $err = $@;
-       die "copy failed: $err" if $err;
+       sleep 1;
     }
 }
 
-sub qemu_img_format {
-    my ($scfg, $volname) = @_;
-
-    if ($scfg->{path} && $volname =~ m/\.(raw|cow|qcow|qcow2|qed|vmdk|cloop)$/) {
-       return $1;
-    } else {
-       return "raw";
-    }
-}
-
-sub qemu_drive_mirror {
-    my ($vmid, $drive, $dst_volid, $vmiddst) = @_;
-
-    my $storecfg = PVE::Storage::config();
-    my ($dst_storeid, $dst_volname) = PVE::Storage::parse_volume_id($dst_volid);
-
-    my $dst_scfg = PVE::Storage::storage_config($storecfg, $dst_storeid);
-
-    my $format = qemu_img_format($dst_scfg, $dst_volname);
-
-    my $dst_path = PVE::Storage::path($storecfg, $dst_volid);
-
-    my $opts = { timeout => 10, device => "drive-$drive", mode => "existing", sync => "full", target => $dst_path };
-    $opts->{format} = $format if $format;
-
-    print "drive mirror is starting (scanning bitmap) : this step can take some minutes/hours, depend of disk size and storage speed\n";
-
-    eval {
-    vm_mon_cmd($vmid, "drive-mirror", %$opts);
-       while (1) {
-           my $stats = vm_mon_cmd($vmid, "query-block-jobs");
-           my $stat = @$stats[0];
-           die "mirroring job seem to have die. Maybe do you have bad sectors?" if !$stat;
-           die "error job is not mirroring" if $stat->{type} ne "mirror";
-
-           my $busy = $stat->{busy};
-           my $ready = $stat->{ready};
-
-           if (my $total = $stat->{len}) {
-               my $transferred = $stat->{offset} || 0;
-               my $remaining = $total - $transferred;
-               my $percent = sprintf "%.2f", ($transferred * 100 / $total);
-
-               print "transferred: $transferred bytes remaining: $remaining bytes total: $total bytes progression: $percent % busy: $busy ready: $ready \n";
-           }
-
-
-           if ($stat->{ready} eq 'true') {
+sub qemu_blockjobs_finish_tunnel {
+   my ($vmid, $job, $cpid) = @_;
 
-               last if $vmiddst != $vmid;
+   return if !$cpid;
 
-               # try to switch the disk if source and destination are on the same guest
-               eval { vm_mon_cmd($vmid, "block-job-complete", device => "drive-$drive") };
-               last if !$@;
-               die $@ if $@ !~ m/cannot be completed/;
-           }
-           sleep 1;
-       }
-
-
-    };
-    my $err = $@;
-
-    my $cancel_job = sub {
-       vm_mon_cmd($vmid, "block-job-cancel", device => "drive-$drive");
-       while (1) {
-           my $stats = vm_mon_cmd($vmid, "query-block-jobs");
-           my $stat = @$stats[0];
-           last if !$stat;
-           sleep 1;
+   for (my $i = 1; $i < 20; $i++) {
+       my $waitpid = waitpid($cpid, WNOHANG);
+       last if (defined($waitpid) && ($waitpid == $cpid));
+       if ($i == 10) {
+           kill(15, $cpid);
+       } elsif ($i >= 15) {
+           kill(9, $cpid);
        }
-    };
-
-    if ($err) {
-       eval { &$cancel_job(); };
-       die "mirroring error: $err";
-    }
-
-    if ($vmiddst != $vmid) {
-       # if we clone a disk for a new target vm, we don't switch the disk
-       &$cancel_job(); # so we call block-job-cancel
+       sleep (1);
     }
+    unlink "/run/qemu-server/$vmid.mirror-$job";
 }
 
 sub clone_disk {
     my ($storecfg, $vmid, $running, $drivename, $drive, $snapname,
-       $newvmid, $storage, $format, $full, $newvollist) = @_;
+       $newvmid, $storage, $format, $full, $newvollist, $jobs, $skipcomplete, $qga) = @_;
 
     my $newvolid;
 
@@ -6495,31 +6202,31 @@ sub clone_disk {
        $newvolid = PVE::Storage::vdisk_clone($storecfg,  $drive->{file}, $newvmid, $snapname);
        push @$newvollist, $newvolid;
     } else {
+
        my ($storeid, $volname) = PVE::Storage::parse_volume_id($drive->{file});
        $storeid = $storage if $storage;
 
-       my ($defFormat, $validFormats) = PVE::Storage::storage_default_format($storecfg, $storeid);
-       if (!$format) {
-           my $scfg = PVE::Storage::storage_config($storecfg, $storeid);
-           $format = qemu_img_format($scfg, $volname);
-       }
-
-       # test if requested format is supported - else use default
-       my $supported = grep { $_ eq $format } @$validFormats;
-       $format = $defFormat if !$supported;
-
+       my $dst_format = resolve_dst_disk_format($storecfg, $storeid, $volname, $format);
        my ($size) = PVE::Storage::volume_size_info($storecfg, $drive->{file}, 3);
 
        print "create full clone of drive $drivename ($drive->{file})\n";
-       $newvolid = PVE::Storage::vdisk_alloc($storecfg, $storeid, $newvmid, $format, undef, ($size/1024));
+       $newvolid = PVE::Storage::vdisk_alloc($storecfg, $storeid, $newvmid, $dst_format, undef, ($size/1024));
        push @$newvollist, $newvolid;
 
-       PVE::Storage::activate_volumes($storecfg, $newvollist);
+       PVE::Storage::activate_volumes($storecfg, [$newvolid]);
 
+       my $sparseinit = PVE::Storage::volume_has_feature($storecfg, 'sparseinit', $newvolid);
        if (!$running || $snapname) {
-           qemu_img_convert($drive->{file}, $newvolid, $size, $snapname);
+           qemu_img_convert($drive->{file}, $newvolid, $size, $snapname, $sparseinit);
        } else {
-           qemu_drive_mirror($vmid, $drivename, $newvolid, $newvmid);
+
+           my $kvmver = get_running_qemu_version ($vmid);
+           if (!qemu_machine_feature_enabled (undef, $kvmver, 2, 7)) {
+               die "drive-mirror with iothread requires qemu version 2.7 or higher\n"
+                   if $drive->{iothread};
+           }
+
+           qemu_drive_mirror($vmid, $drivename, $newvolid, $newvmid, $sparseinit, $jobs, $skipcomplete, $qga);
        }
     }
 
@@ -6550,6 +6257,13 @@ sub get_current_qemu_machine {
     return $current || $default || 'pc';
 }
 
+sub get_running_qemu_version {
+    my ($vmid) = @_;
+    my $cmd = { execute => 'query-version', arguments => {} };
+    my $res = vm_qmp_command($vmid, $cmd);
+    return "$res->{qemu}->{major}.$res->{qemu}->{minor}";
+}
+
 sub qemu_machine_feature_enabled {
     my ($machine, $kvmver, $version_major, $version_minor) = @_;
 
@@ -6586,6 +6300,7 @@ sub qemu_machine_pxe {
        last;
     }
 
+    return $machine;
 }
 
 sub qemu_use_old_bios_files {
@@ -6599,16 +6314,35 @@ sub qemu_use_old_bios_files {
         $machine_type = $1;
         $use_old_bios_files = 1;
     } else {
+       my $kvmver = kvm_user_version();
         # Note: kvm version < 2.4 use non-efi pxe files, and have problems when we
         # load new efi bios files on migration. So this hack is required to allow
         # live migration from qemu-2.2 to qemu-2.4, which is sometimes used when
         # updrading from proxmox-ve-3.X to proxmox-ve 4.0
-        $use_old_bios_files = !qemu_machine_feature_enabled ($machine_type, undef, 2, 4);
+       $use_old_bios_files = !qemu_machine_feature_enabled ($machine_type, $kvmver, 2, 4);
     }
 
     return ($use_old_bios_files, $machine_type);
 }
 
+sub create_efidisk {
+    my ($storecfg, $storeid, $vmid, $fmt) = @_;
+
+    die "EFI vars default image not found\n" if ! -f $OVMF_VARS;
+
+    my $vars_size = PVE::Tools::convert_size(-s $OVMF_VARS, 'b' => 'kb');
+    my $volid = PVE::Storage::vdisk_alloc($storecfg, $storeid, $vmid, $fmt, undef, $vars_size);
+    PVE::Storage::activate_volumes($storecfg, [$volid]);
+
+    my $path = PVE::Storage::path($storecfg, $volid);
+    eval {
+       run_command(['/usr/bin/qemu-img', 'convert', '-n', '-f', 'raw', '-O', $fmt, $OVMF_VARS, $path]);
+    };
+    die "Copying EFI vars image failed: $@" if $@;
+
+    return ($volid, $vars_size);
+}
+
 sub lspci {
 
     my $devices = {};
@@ -6619,6 +6353,12 @@ sub lspci {
            push @{$devices->{$id}}, $res;
     });
 
+    # Entries should be sorted by functions.
+    foreach my $id (keys %$devices) {
+       my $dev = $devices->{$id};
+       $devices->{$id} = [ sort { $a->{function} <=> $b->{function} } @$dev ];
+    }
+
     return $devices;
 }
 
@@ -6640,7 +6380,7 @@ sub scsihw_infos {
 
     my $maxdev = 0;
 
-    if ($conf->{scsihw} && ($conf->{scsihw} =~ m/^lsi/)) {
+    if (!$conf->{scsihw} || ($conf->{scsihw} =~ m/^lsi/)) {
         $maxdev = 7;
     } elsif ($conf->{scsihw} && ($conf->{scsihw} eq 'virtio-scsi-single')) {
         $maxdev = 1;
@@ -6654,6 +6394,91 @@ sub scsihw_infos {
     return ($maxdev, $controller, $controller_prefix);
 }
 
+sub add_hyperv_enlightenments {
+    my ($cpuFlags, $winversion, $machine_type, $kvmver, $bios, $gpu_passthrough) = @_;
+
+    return if $winversion < 6;
+    return if $bios && $bios eq 'ovmf' && $winversion < 8;
+
+    push @$cpuFlags , 'hv_vendor_id=proxmox' if $gpu_passthrough;
+
+    if (qemu_machine_feature_enabled ($machine_type, $kvmver, 2, 3)) {
+       push @$cpuFlags , 'hv_spinlocks=0x1fff';
+       push @$cpuFlags , 'hv_vapic';
+       push @$cpuFlags , 'hv_time';
+    } else {
+       push @$cpuFlags , 'hv_spinlocks=0xffff';
+    }
+
+    if (qemu_machine_feature_enabled ($machine_type, $kvmver, 2, 6)) {
+       push @$cpuFlags , 'hv_reset';
+       push @$cpuFlags , 'hv_vpindex';
+       push @$cpuFlags , 'hv_runtime';
+    }
+
+    if ($winversion >= 7) {
+       push @$cpuFlags , 'hv_relaxed';
+    }
+}
+
+sub windows_version {
+    my ($ostype) = @_;
+
+    return 0 if !$ostype;
+
+    my $winversion = 0;
+
+    if($ostype eq 'wxp' || $ostype eq 'w2k3' || $ostype eq 'w2k') {
+        $winversion = 5;
+    } elsif($ostype eq 'w2k8' || $ostype eq 'wvista') {
+        $winversion = 6;
+    } elsif ($ostype =~ m/^win(\d+)$/) {
+        $winversion = $1;
+    }
+
+    return $winversion;
+}
+
+sub resolve_dst_disk_format {
+       my ($storecfg, $storeid, $src_volname, $format) = @_;
+       my ($defFormat, $validFormats) = PVE::Storage::storage_default_format($storecfg, $storeid);
+
+       if (!$format) {
+           # if no target format is specified, use the source disk format as hint
+           if ($src_volname) {
+               my $scfg = PVE::Storage::storage_config($storecfg, $storeid);
+               $format = qemu_img_format($scfg, $src_volname);
+           } else {
+               return $defFormat;
+           }
+       }
+
+       # test if requested format is supported - else use default
+       my $supported = grep { $_ eq $format } @$validFormats;
+       $format = $defFormat if !$supported;
+       return $format;
+}
+
+sub resolve_first_disk {
+    my $conf = shift;
+    my @disks = PVE::QemuServer::valid_drive_names();
+    my $firstdisk;
+    foreach my $ds (reverse @disks) {
+       next if !$conf->{$ds};
+       my $disk = PVE::QemuServer::parse_drive($ds, $conf->{$ds});
+       next if PVE::QemuServer::drive_is_cdrom($disk);
+       $firstdisk = $ds;
+    }
+    return $firstdisk;
+}
+
+sub generate_smbios1_uuid {
+    my ($uuid, $uuid_str);
+    UUID::generate($uuid);
+    UUID::unparse($uuid, $uuid_str);
+    return "uuid=$uuid_str";
+}
+
 # bash completion helper
 
 sub complete_backup_archives {
@@ -6727,4 +6552,10 @@ sub complete_storage {
     return $res;
 }
 
+sub nbd_stop {
+    my ($vmid) = @_;
+
+    vm_mon_cmd($vmid, 'nbd-server-stop');
+}
+
 1;