]> git.proxmox.com Git - qemu-server.git/blobdiff - PVE/QemuMigrate.pm
add vmxnet3 to list of available network card models
[qemu-server.git] / PVE / QemuMigrate.pm
index d5ee0351a70299d16cf2f487d47469a1eff0f2fa..634c305bca07d4f3b67a1430c644de9471504577 100644 (file)
@@ -2,67 +2,21 @@ package PVE::QemuMigrate;
 
 use strict;
 use warnings;
-use POSIX qw(strftime);
+use PVE::AbstractMigrate;
 use IO::File;
 use IPC::Open2;
-use PVE::Tools qw(run_command);
-use PVE::SafeSyslog;
 use PVE::INotify;
+use PVE::Tools;
 use PVE::Cluster;
 use PVE::Storage;
 use PVE::QemuServer;
+use Time::HiRes qw( usleep );
+use PVE::RPCEnvironment;
 
-my $delayed_interrupt = 0;
-
-# blowfish is a fast block cipher, much faster then 3des
-my @ssh_opts = ('-c', 'blowfish', '-o', 'BatchMode=yes');
-my @ssh_cmd = ('/usr/bin/ssh', @ssh_opts);
-my @scp_cmd = ('/usr/bin/scp', @ssh_opts);
-my $qm_cmd = '/usr/sbin/qm';
-
-sub logmsg {
-    my ($level, $msg) = @_;
-
-    chomp $msg;
-
-    return if !$msg;
-
-    my $tstr = strftime("%b %d %H:%M:%S", localtime);
-
-    syslog($level, $msg);
-
-    foreach my $line (split (/\n/, $msg)) {
-       print STDOUT "$tstr $line\n";
-    }
-    \*STDOUT->flush();
-}
-
-sub eval_int {
-    my ($func) = @_;
-
-    eval {
-       local $SIG{INT} = $SIG{TERM} = $SIG{QUIT} = $SIG{HUP} = sub {
-           $delayed_interrupt = 0;
-           logmsg('err', "received interrupt");
-           die "interrupted by signal\n";
-       };
-       local $SIG{PIPE} = sub {
-           $delayed_interrupt = 0;
-           logmsg('err', "received broken pipe interrupt");
-           die "interrupted by signal\n";
-       };
-
-       my $di = $delayed_interrupt;
-       $delayed_interrupt = 0;
-
-       die "interrupted by signal\n" if $di;
-
-       &$func();
-    };
-}
+use base qw(PVE::AbstractMigrate);
 
 sub fork_command_pipe {
-    my ($cmd) = @_;
+    my ($self, $cmd) = @_;
 
     my $reader = IO::File->new();
     my $writer = IO::File->new();
@@ -77,7 +31,7 @@ sub fork_command_pipe {
 
     # catch exec errors
     if ($orig_pid != $$) {
-       logmsg('err', "can't fork command pipe\n");
+       $self->log('err', "can't fork command pipe\n");
        POSIX::_exit(1);
        kill('KILL', $$);
     }
@@ -88,7 +42,7 @@ sub fork_command_pipe {
 }
 
 sub finish_command_pipe {
-    my $cmdpipe = shift;
+    my ($self, $cmdpipe, $timeout) = @_;
 
     my $writer = $cmdpipe->{writer};
     my $reader = $cmdpipe->{reader};
@@ -98,59 +52,41 @@ sub finish_command_pipe {
 
     my $cpid = $cmdpipe->{pid};
 
-    kill(15, $cpid) if kill(0, $cpid);
-
-    waitpid($cpid, 0);
-}
-
-sub run_with_timeout {
-    my ($timeout, $code, @param) = @_;
-
-    die "got timeout\n" if $timeout <= 0;
-
-    my $prev_alarm;
-
-    my $sigcount = 0;
-
-    my $res;
-
-    eval {
-       local $SIG{ALRM} = sub { $sigcount++; die "got timeout\n"; };
-       local $SIG{PIPE} = sub { $sigcount++; die "broken pipe\n" };
-       local $SIG{__DIE__};   # see SA bug 4631
-
-       $prev_alarm = alarm($timeout);
-
-       $res = &$code(@param);
-
-       alarm(0); # avoid race conditions
-    };
-
-    my $err = $@;
-
-    alarm($prev_alarm) if defined($prev_alarm);
+    if ($timeout) {
+       for (my $i = 0; $i < $timeout; $i++) {
+           return if !PVE::ProcFSTools::check_process_running($cpid);
+           sleep(1);
+       }
+    }
 
-    die "unknown error" if $sigcount && !$err; # seems to happen sometimes
+    $self->log('info', "ssh tunnel still running - terminating now with SIGTERM\n");
+    kill(15, $cpid);
 
-    die $err if $err;
+    # wait again
+    for (my $i = 0; $i < 10; $i++) {
+       return if !PVE::ProcFSTools::check_process_running($cpid);
+       sleep(1);
+    }
 
-    return $res;
+    $self->log('info', "ssh tunnel still running - terminating now with SIGKILL\n");
+    kill 9, $cpid;
+    sleep 1;
 }
 
 sub fork_tunnel {
-    my ($nodeip, $lport, $rport) = @_;
+    my ($self, $nodeip, $lport, $rport) = @_;
+
+    my @localtunnelinfo = $lport ? ('-L' , "$lport:localhost:$rport" ) : ();
 
-    my $cmd = [@ssh_cmd, '-o', 'BatchMode=yes',
-              '-L', "$lport:localhost:$rport", $nodeip,
-              'qm', 'mtunnel' ];
+    my $cmd = [@{$self->{rem_ssh}}, @localtunnelinfo, 'qm', 'mtunnel' ];
 
-    my $tunnel = fork_command_pipe($cmd);
+    my $tunnel = $self->fork_command_pipe($cmd);
 
     my $reader = $tunnel->{reader};
 
     my $helo;
     eval {
-       run_with_timeout(60, sub { $helo = <$reader>; });
+       PVE::Tools::run_with_timeout(60, sub { $helo = <$reader>; });
        die "no reply\n" if !$helo;
        die "no quorum on target node\n" if $helo =~ m/^no quorum$/;
        die "got strange reply from mtunnel ('$helo')\n"
@@ -159,187 +95,85 @@ sub fork_tunnel {
     my $err = $@;
 
     if ($err) {
-       finish_command_pipe($tunnel);
+       $self->finish_command_pipe($tunnel);
        die "can't open migration tunnel - $err";
     }
     return $tunnel;
 }
 
 sub finish_tunnel {
-    my $tunnel = shift;
+    my ($self, $tunnel) = @_;
 
     my $writer = $tunnel->{writer};
 
     eval {
-       run_with_timeout(30, sub {
+       PVE::Tools::run_with_timeout(30, sub {
            print $writer "quit\n";
            $writer->flush();
        });
     };
     my $err = $@;
 
-    finish_command_pipe($tunnel);
+    $self->finish_command_pipe($tunnel, 30);
 
     die $err if $err;
 }
 
-sub migrate {
-    my ($node, $nodeip, $vmid, $online, $force) = @_;
-
-    my $starttime = time();
-
-    my $rem_ssh = [@ssh_cmd, "root\@$nodeip"];
-
-    local $SIG{INT} = $SIG{TERM} = $SIG{QUIT} = $SIG{HUP} = $SIG{PIPE} = sub {
-       logmsg('err', "received interrupt - delayed");
-       $delayed_interrupt = 1;
-    };
-
-    local $ENV{RSYNC_RSH} = join(' ', @ssh_cmd);
-
-    my $session = {
-       vmid => $vmid,
-       node => $node,
-       nodeip => $nodeip,
-       force => $force,
-       storecfg => PVE::Storage::config(),
-       rem_ssh => $rem_ssh,
-    };
-    
-    my $errors;
-
-    # lock config during migration
-    eval { PVE::QemuServer::lock_config($vmid, sub {
-
-       eval_int(sub { prepare($session); });
-       die $@ if $@;
-
-       my $conf = PVE::QemuServer::load_config($vmid);
+sub lock_vm {
+    my ($self, $vmid, $code, @param) = @_;
 
-       PVE::QemuServer::check_lock($conf);
-
-       my $running = 0;
-       if (my $pid = PVE::QemuServer::check_running($vmid)) {
-           die "cant migrate running VM without --online\n" if !$online;
-           $running = $pid;
-       }
-
-       my $rhash = {};
-       eval_int (sub { phase1($session, $conf, $rhash, $running); });
-       my $err = $@;
-
-       if ($err) {
-           if ($rhash->{clearlock}) {
-               my $unset = { lock => 1 };
-               eval { PVE::QemuServer::change_config_nolock($session->{vmid}, {}, $unset, 1) };
-               logmsg('err', $@) if $@;
-           }
-           if ($rhash->{volumes}) {
-               foreach my $volid (@{$rhash->{volumes}}) {
-                   logmsg('err', "found stale volume copy '$volid' on node '$session->{node}'");
-               }
-           }
-           die $err;
-       }
-
-       # vm is now owned by other node
-       my $volids = $rhash->{volumes};
-
-       if ($running) {
-
-           $rhash = {};
-           eval_int(sub { phase2($session, $conf, $rhash); });
-           my $err = $@;
-
-           # always kill tunnel
-           if ($rhash->{tunnel}) {
-               eval_int(sub { finish_tunnel($rhash->{tunnel}) });
-               if ($@) {
-                   logmsg('err', "stopping tunnel failed - $@");
-                   $errors = 1;
-               }
-           }
-
-           # fixme: ther is no config file, so this will never work
-           # fixme: use kill(9, $running) to make sure it is stopped
-           # always stop local VM - no interrupts possible
-           eval { PVE::QemuServer::vm_stop($session->{vmid}, 1); };
-           if ($@) {
-               logmsg('err', "stopping vm failed - $@");
-               $errors = 1;
-           }
+    return PVE::QemuServer::lock_config($vmid, $code, @param);
+}
 
-           if ($err) {
-               $errors = 1;
-               logmsg('err', "online migrate failure - $err");
-           }
-       }
+sub prepare {
+    my ($self, $vmid) = @_;
 
-       # finalize -- clear migrate lock
-       eval_int(sub {
-           my $cmd = [ @{$session->{rem_ssh}}, $qm_cmd, 'unlock', $session->{vmid} ];
-           run_command($cmd);
-       });
-       if ($@) {
-           logmsg('err', "failed to clear migrate lock - $@");
-           $errors = 1;
-       }
+    my $online = $self->{opts}->{online};
 
-       # destroy local copies
-       foreach my $volid (@$volids) {
-           eval_int(sub { PVE::Storage::vdisk_free($session->{storecfg}, $volid); });
-           my $err = $@;
+    $self->{storecfg} = PVE::Storage::config();
 
-           if ($err) {
-               logmsg('err', "removing local copy of '$volid' failed - $err");
-               $errors = 1;
+    # test is VM exist
+    my $conf = $self->{vmconf} = PVE::QemuServer::load_config($vmid);
 
-               last if $err =~ /^interrupted by signal$/;
-           }
-       }
-    })};
+    PVE::QemuServer::check_lock($conf);
 
-    my $err = $@;
-
-    my $delay = time() - $starttime;
-    my $mins = int($delay/60);
-    my $secs = $delay - $mins*60;
-    my $hours =  int($mins/60);
-    $mins = $mins - $hours*60;
-
-    my $duration = sprintf "%02d:%02d:%02d", $hours, $mins, $secs;
-
-    if ($err) {
-       my $msg = "migration aborted (duration $duration): $err\n";
-       logmsg('err', $msg);
-       die $msg;
+    my $running = 0;
+    if (my $pid = PVE::QemuServer::check_running($vmid)) {
+       die "cant migrate running VM without --online\n" if !$online;
+       $running = $pid;
+       $self->{forcemachine} = PVE::QemuServer::get_current_qemu_machine($vmid);
     }
 
-    if ($errors) {
-       my $msg = "migration finished with problems (duration $duration)\n";
-       logmsg('err', $msg);
-       die $msg;
+    if (my $loc_res = PVE::QemuServer::check_local_resources($conf, 1)) {
+       if ($self->{running} || !$self->{opts}->{force}) {
+           die "can't migrate VM which uses local devices\n";
+       } else {
+           $self->log('info', "migrating VM which uses local devices");
+       }
     }
 
-    logmsg('info', "migration finished successfuly (duration $duration)");
-}
-
-sub prepare {
-    my ($session) = @_;
+    # activate volumes
+    my $vollist = PVE::QemuServer::get_vm_volumes($conf);
+    PVE::Storage::activate_volumes($self->{storecfg}, $vollist);
 
-    my $conffile = PVE::QemuServer::config_file($session->{vmid});
-    die "VM $session->{vmid} does not exist on this node\n" if ! -f $conffile;
+    # fixme: check if storage is available on both nodes
 
     # test ssh connection
-    my $cmd = [ @{$session->{rem_ssh}}, '/bin/true' ];
-    eval { run_command($cmd); };
+    my $cmd = [ @{$self->{rem_ssh}}, '/bin/true' ];
+    eval { $self->cmd_quiet($cmd); };
     die "Can't connect to destination address using public key\n" if $@;
+
+    return $running;
 }
 
 sub sync_disks {
-    my ($session, $conf, $rhash, $running) = @_;
+    my ($self, $vmid) = @_;
 
-    logmsg('info', "copying disk images");
+    $self->log('info', "copying disk images");
+
+    my $conf = $self->{vmconf};
+
+    $self->{volumes} = [];
 
     my $res = [];
 
@@ -348,30 +182,37 @@ sub sync_disks {
        my $volhash = {};
        my $cdromhash = {};
 
-       # get list from PVE::Storage (for unused volumes)
-       my $dl = PVE::Storage::vdisk_list($session->{storecfg}, undef, $session->{vmid});
-       PVE::Storage::foreach_volid($dl, sub {
-           my ($volid, $sid, $volname) = @_;
+       my $sharedvm = 1;
 
-           my $scfg =  PVE::Storage::storage_config($session->{storecfg}, $sid);
+       my @sids = PVE::Storage::storage_ids($self->{storecfg});
+        foreach my $storeid (@sids) {
+           my $scfg = PVE::Storage::storage_config($self->{storecfg}, $storeid);
+            next if $scfg->{shared};
+           next if !PVE::Storage::storage_check_enabled($self->{storecfg}, $storeid, undef, 1);
 
-           return if $scfg->{shared};
+            # get list from PVE::Storage (for unused volumes)
+            my $dl = PVE::Storage::vdisk_list($self->{storecfg}, $storeid, $vmid);
+            PVE::Storage::foreach_volid($dl, sub {
+                my ($volid, $sid, $volname) = @_;
 
-           $volhash->{$volid} = 1;
-       });
+                # check if storage is available on target node
+                PVE::Storage::storage_check_node($self->{storecfg}, $sid, $self->{node});
 
-       # and add used,owned/non-shared disks (just to be sure we have all)
+                $volhash->{$volid} = 1;
+               $sharedvm = 0; # there is a non-shared disk
+            });
+        }
 
-       my $sharedvm = 1;
-       PVE::QemuServer::foreach_drive($conf, sub {
-           my ($ds, $drive) = @_;
+       # and add used, owned/non-shared disks (just to be sure we have all)
+
+       PVE::QemuServer::foreach_volid($conf, sub {
+           my ($volid, $is_cdrom) = @_;
 
-           my $volid = $drive->{file};
            return if !$volid;
 
            die "cant migrate local file/device '$volid'\n" if $volid =~ m|^/|;
 
-           if (PVE::QemuServer::drive_is_cdrom($drive)) {
+           if ($is_cdrom) {
                die "cant migrate local cdrom drive\n" if $volid eq 'cdrom';
                return if $volid eq 'none';
                $cdromhash->{$volid} = 1;
@@ -379,7 +220,9 @@ sub sync_disks {
 
            my ($sid, $volname) = PVE::Storage::parse_volume_id($volid);
 
-           my $scfg =  PVE::Storage::storage_config($session->{storecfg}, $sid);
+           # check if storage is available on both nodes
+           my $scfg = PVE::Storage::storage_check_node($self->{storecfg}, $sid);
+           PVE::Storage::storage_check_node($self->{storecfg}, $sid, $self->{node});
 
            return if $scfg->{shared};
 
@@ -387,135 +230,415 @@ sub sync_disks {
 
            $sharedvm = 0;
 
-           my ($path, $owner) = PVE::Storage::path($session->{storecfg}, $volid);
+           my ($path, $owner) = PVE::Storage::path($self->{storecfg}, $volid);
 
            die "can't migrate volume '$volid' - owned by other VM (owner = VM $owner)\n"
-               if !$owner || ($owner != $session->{vmid});
+               if !$owner || ($owner != $self->{vmid});
 
            $volhash->{$volid} = 1;
        });
 
-       if ($running && !$sharedvm) {
+       if ($self->{running} && !$sharedvm) {
            die "can't do online migration - VM uses local disks\n";
        }
 
        # do some checks first
        foreach my $volid (keys %$volhash) {
            my ($sid, $volname) = PVE::Storage::parse_volume_id($volid);
-           my $scfg =  PVE::Storage::storage_config($session->{storecfg}, $sid);
+           my $scfg =  PVE::Storage::storage_config($self->{storecfg}, $sid);
 
            die "can't migrate '$volid' - storagy type '$scfg->{type}' not supported\n"
                if $scfg->{type} ne 'dir';
+
+           # if file, check if a backing file exist
+           if (($scfg->{type} eq 'dir') && (!$sharedvm)) {
+               my (undef, undef, undef, $parent) = PVE::Storage::volume_size_info($self->{storecfg}, $volid, 1);
+               die "can't migrate '$volid' as it's a clone of '$parent'" if $parent;
+           }
        }
 
        foreach my $volid (keys %$volhash) {
            my ($sid, $volname) = PVE::Storage::parse_volume_id($volid);
-           push @{$rhash->{volumes}}, $volid;
-           PVE::Storage::storage_migrate($session->{storecfg}, $volid, $session->{nodeip}, $sid);
+           push @{$self->{volumes}}, $volid;
+           PVE::Storage::storage_migrate($self->{storecfg}, $volid, $self->{nodeip}, $sid);
        }
     };
     die "Failed to sync data - $@" if $@;
 }
 
 sub phase1 {
-    my ($session, $conf, $rhash, $running) = @_;
+    my ($self, $vmid) = @_;
 
-    logmsg('info', "starting migration of VM $session->{vmid} to node '$session->{node}' ($session->{nodeip})");
+    $self->log('info', "starting migration of VM $vmid to node '$self->{node}' ($self->{nodeip})");
 
-    if (my $loc_res = PVE::QemuServer::check_local_resources($conf, 1)) {
-       if ($running || !$session->{force}) {
-           die "can't migrate VM which uses local devices\n";
-       } else {
-           logmsg('info', "migrating VM which uses local devices");
-       }
-    }
+    my $conf = $self->{vmconf};
 
     # set migrate lock in config file
-    $rhash->{clearlock} = 1;
+    $conf->{lock} = 'migrate';
+    PVE::QemuServer::update_config_nolock($vmid, $conf, 1);
 
-    PVE::QemuServer::change_config_nolock($session->{vmid}, { lock => 'migrate' }, {}, 1);
+    sync_disks($self, $vmid);
 
-    sync_disks($session, $conf, $rhash, $running);
+};
 
-    # move config to remote node
-    my $conffile = PVE::QemuServer::config_file($session->{vmid});
-    my $newconffile = PVE::QemuServer::config_file($session->{vmid}, $session->{node});
+sub phase1_cleanup {
+    my ($self, $vmid, $err) = @_;
 
-    die "Failed to move config to node '$session->{node}' - rename failed: $!\n"
-       if !rename($conffile, $newconffile);
-};
+    $self->log('info', "aborting phase 1 - cleanup resources");
+
+    my $conf = $self->{vmconf};
+    delete $conf->{lock};
+    eval { PVE::QemuServer::update_config_nolock($vmid, $conf, 1) };
+    if (my $err = $@) {
+       $self->log('err', $err);
+    }
+
+    if ($self->{volumes}) {
+       foreach my $volid (@{$self->{volumes}}) {
+           $self->log('err', "found stale volume copy '$volid' on node '$self->{node}'");
+           # fixme: try to remove ?
+       }
+    }
+}
 
 sub phase2 {
-    my ($session, $conf, $rhash) = shift;
+    my ($self, $vmid) = @_;
+
+    my $conf = $self->{vmconf};
 
-    logmsg('info', "starting VM on remote node '$session->{node}'");
+    $self->log('info', "starting VM $vmid on remote node '$self->{node}'");
 
+    my $raddr;
     my $rport;
+    my $nodename = PVE::INotify::nodename();
 
     ## start on remote node
-    my $cmd = [@{$session->{rem_ssh}}, $qm_cmd, 'start', 
-              $session->{vmid}, '--stateuri', 'tcp', '--skiplock'];
+    my $cmd = [@{$self->{rem_ssh}}];
 
-    run_command($cmd, outfunc => sub {
+    my $spice_ticket;
+    if (PVE::QemuServer::vga_conf_has_spice($conf->{vga})) {
+       my $res = PVE::QemuServer::vm_mon_cmd($vmid, 'query-spice');
+       $spice_ticket = $res->{ticket};
+    }
+
+    push @$cmd , 'qm', 'start', $vmid, '--stateuri', 'tcp', '--skiplock', '--migratedfrom', $nodename;
+
+    if ($self->{forcemachine}) {
+       push @$cmd, '--machine', $self->{forcemachine};
+    }
+
+    my $spice_port;
+
+    # Note: We try to keep $spice_ticket secret (do not pass via command line parameter)
+    # instead we pipe it through STDIN
+    PVE::Tools::run_command($cmd, input => $spice_ticket, outfunc => sub {
        my $line = shift;
 
-       if ($line =~ m/^migration listens on port (\d+)$/) {
-           $rport = $1;
+       if ($line =~ m/^migration listens on tcp:([\d\.]+|localhost):(\d+)$/) {
+           $raddr = $1;
+           $rport = int($2);
        }
+       elsif ($line =~ m/^migration listens on port (\d+)$/) {
+           $raddr = "localhost";
+           $rport = int($1);
+       }
+        elsif ($line =~ m/^spice listens on port (\d+)$/) {
+           $spice_port = int($1);
+       }
+    }, errfunc => sub {
+       my $line = shift;
+       $self->log('info', $line);
     });
 
-    die "unable to detect remote migration port\n" if !$rport;
-
-    logmsg('info', "starting migration tunnel");
+    die "unable to detect remote migration address\n" if !$raddr;
 
     ## create tunnel to remote port
-    my $lport = PVE::QemuServer::next_migrate_port();
-    $rhash->{tunnel} = fork_tunnel($session->{nodeip}, $lport, $rport);
-
-    logmsg('info', "starting online/live migration");
-    # start migration
+    $self->log('info', "starting ssh migration tunnel");
+    my $lport = ($raddr eq "localhost") ? PVE::Tools::next_migrate_port() : undef;
+    $self->{tunnel} = $self->fork_tunnel($self->{nodeip}, $lport, $rport);
 
     my $start = time();
+    $self->log('info', "starting online/live migration on $raddr:$rport");
+    $self->{livemigration} = 1;
+
+    # load_defaults
+    my $defaults = PVE::QemuServer::load_defaults();
+
+    # always set migrate speed (overwrite kvm default of 32m)
+    # we set a very hight default of 8192m which is basically unlimited
+    my $migrate_speed = $defaults->{migrate_speed} || 8192;
+    $migrate_speed = $conf->{migrate_speed} || $migrate_speed;
+    $migrate_speed = $migrate_speed * 1048576;
+    $self->log('info', "migrate_set_speed: $migrate_speed");
+    eval {
+        PVE::QemuServer::vm_mon_cmd_nocheck($vmid, "migrate_set_speed", value => int($migrate_speed));
+    };
+    $self->log('info', "migrate_set_speed error: $@") if $@;
+
+    my $migrate_downtime = $defaults->{migrate_downtime};
+    $migrate_downtime = $conf->{migrate_downtime} if defined($conf->{migrate_downtime});
+    if (defined($migrate_downtime)) {
+       $self->log('info', "migrate_set_downtime: $migrate_downtime");
+       eval {
+           PVE::QemuServer::vm_mon_cmd_nocheck($vmid, "migrate_set_downtime", value => int($migrate_downtime*100)/100);
+       };
+       $self->log('info', "migrate_set_downtime error: $@") if $@;
+    }
 
-    PVE::QemuServer::vm_monitor_command($session->{vmid}, "migrate -d \"tcp:localhost:$lport\"");
+    my $capabilities = {};
+    $capabilities->{capability} =  "xbzrle";
+    $capabilities->{state} = JSON::false;
 
-    my $lstat = '';
+    eval {
+       PVE::QemuServer::vm_mon_cmd_nocheck($vmid, "migrate-set-capabilities", capabilities => [$capabilities]);
+    };
+
+    #set cachesize 10% of the total memory
+    my $cachesize = int($conf->{memory}*1048576/10);
+    eval {
+       PVE::QemuServer::vm_mon_cmd_nocheck($vmid, "migrate-set-cache-size", value => $cachesize);
+    };
+       
+    if (PVE::QemuServer::vga_conf_has_spice($conf->{vga})) {
+       my $rpcenv = PVE::RPCEnvironment::get();
+       my $authuser = $rpcenv->get_user();
+
+       my (undef, $proxyticket) = PVE::AccessControl::assemble_spice_ticket($authuser, $vmid, $self->{node});
+
+       my $filename = "/etc/pve/nodes/$self->{node}/pve-ssl.pem";
+        my $subject = PVE::QemuServer::read_x509_subject_spice($filename);
+
+       $self->log('info', "spice client_migrate_info");
+
+       eval {
+           PVE::QemuServer::vm_mon_cmd_nocheck($vmid, "client_migrate_info", protocol => 'spice', 
+                                               hostname => $proxyticket, 'tls-port' => $spice_port, 
+                                               'cert-subject' => $subject);
+       };
+       $self->log('info', "client_migrate_info error: $@") if $@;
+
+    }
+
+    eval {
+        PVE::QemuServer::vm_mon_cmd_nocheck($vmid, "migrate", uri => "tcp:$raddr:$rport");
+    };
+    my $merr = $@;
+    $self->log('info', "migrate uri => tcp:$raddr:$rport failed: $merr") if $merr;
+
+    my $lstat = 0;
+    my $usleep = 2000000;
+    my $i = 0;
+    my $err_count = 0;
+    my $lastrem = undef;
+    my $downtimecounter = 0;
     while (1) {
-       sleep (2);
-       my $stat = PVE::QemuServer::vm_monitor_command($session->{vmid}, "info migrate", 1);
-       if ($stat =~ m/^Migration status: (active|completed|failed|cancelled)$/im) {
-           my $ms = $1;
-
-           if ($stat ne $lstat) {
-               if ($ms eq 'active') {
-                   my ($trans, $rem, $total) = (0, 0, 0);
-                   $trans = $1 if $stat =~ m/^transferred ram: (\d+) kbytes$/im;
-                   $rem = $1 if $stat =~ m/^remaining ram: (\d+) kbytes$/im;
-                   $total = $1 if $stat =~ m/^total ram: (\d+) kbytes$/im;
-
-                   logmsg('info', "migration status: $ms (transferred ${trans}KB, " .
-                           "remaining ${rem}KB), total ${total}KB)");
-               } else {
-                   logmsg('info', "migration status: $ms");
-               }
-           }
+       $i++;
+       my $avglstat = $lstat/$i if $lstat;
 
-           if ($ms eq 'completed') {
+       usleep($usleep);
+       my $stat;
+       eval {
+           $stat = PVE::QemuServer::vm_mon_cmd_nocheck($vmid, "query-migrate");
+       };
+       if (my $err = $@) {
+           $err_count++;
+           warn "query migrate failed: $err\n";
+           if ($err_count <= 5) {
+               usleep(1000000);
+               next;
+           }
+           die "too many query migrate failures - aborting\n";
+       }
+       if ($stat->{status} =~ m/^(active|completed|failed|cancelled)$/im) {
+           $merr = undef;
+           $err_count = 0;
+           if ($stat->{status} eq 'completed') {
                my $delay = time() - $start;
                if ($delay > 0) {
                    my $mbps = sprintf "%.2f", $conf->{memory}/$delay;
-                   logmsg('info', "migration speed: $mbps MB/s");
+                   my $downtime = $stat->{downtime} || 0;
+                   $self->log('info', "migration speed: $mbps MB/s - downtime $downtime ms");
                }
            }
 
-           if ($ms eq 'failed' || $ms eq 'cancelled') {
+           if ($stat->{status} eq 'failed' || $stat->{status} eq 'cancelled') {
                die "aborting\n"
            }
 
-           last if $ms ne 'active';
+           if ($stat->{status} ne 'active') {
+               $self->log('info', "migration status: $stat->{status}");
+               last;
+           }
+
+           if ($stat->{ram}->{transferred} ne $lstat) {
+               my $trans = $stat->{ram}->{transferred} || 0;
+               my $rem = $stat->{ram}->{remaining} || 0;
+               my $total = $stat->{ram}->{total} || 0;
+               my $xbzrlecachesize = $stat->{"xbzrle-cache"}->{"cache-size"} || 0;
+               my $xbzrlebytes = $stat->{"xbzrle-cache"}->{"bytes"} || 0;
+               my $xbzrlepages = $stat->{"xbzrle-cache"}->{"pages"} || 0;
+               my $xbzrlecachemiss = $stat->{"xbzrle-cache"}->{"cache-miss"} || 0;
+               my $xbzrleoverflow = $stat->{"xbzrle-cache"}->{"overflow"} || 0;
+               #reduce sleep if remainig memory if lower than the everage transfert 
+               $usleep = 300000 if $avglstat && $rem < $avglstat;
+
+               $self->log('info', "migration status: $stat->{status} (transferred ${trans}, " .
+                          "remaining ${rem}), total ${total})");
+
+               #$self->log('info', "migration xbzrle cachesize: ${xbzrlecachesize} transferred ${xbzrlebytes} pages ${xbzrlepages} cachemiss ${xbzrlecachemiss} overflow ${xbzrleoverflow}");
+               if (($lastrem  && $rem > $lastrem ) || ($rem == 0)) {
+                   $downtimecounter++;
+               }
+               $lastrem = $rem;
+
+               if ($downtimecounter > 5) {
+                   $downtimecounter = 0;
+                   $migrate_downtime *= 2;
+                   $self->log('info', "migrate_set_downtime: $migrate_downtime");
+                   eval {
+                       PVE::QemuServer::vm_mon_cmd_nocheck($vmid, "migrate_set_downtime", value => int($migrate_downtime*100)/100);
+                   };
+                   $self->log('info', "migrate_set_downtime error: $@") if $@;
+               }
+
+           }
+
+
+           $lstat = $stat->{ram}->{transferred};
+           
        } else {
-           die "unable to parse migration status '$stat' - aborting\n";
+           die $merr if $merr;
+           die "unable to parse migration status '$stat->{status}' - aborting\n";
        }
-       $lstat = $stat;
+    }
+}
+
+sub phase2_cleanup {
+    my ($self, $vmid, $err) = @_;
+
+    return if !$self->{errors};
+    $self->{phase2errors} = 1;
+
+    $self->log('info', "aborting phase 2 - cleanup resources");
+
+    $self->log('info', "migrate_cancel");
+    eval {
+       PVE::QemuServer::vm_mon_cmd_nocheck($vmid, "migrate_cancel");
     };
+    $self->log('info', "migrate_cancel error: $@") if $@;
+
+    my $conf = $self->{vmconf};
+    delete $conf->{lock};
+    eval { PVE::QemuServer::update_config_nolock($vmid, $conf, 1) };
+    if (my $err = $@) {
+        $self->log('err', $err);
+    }
+
+    # cleanup ressources on target host
+    my $nodename = PVE::INotify::nodename();
+    my $cmd = [@{$self->{rem_ssh}}, 'qm', 'stop', $vmid, '--skiplock', '--migratedfrom', $nodename];
+    eval{ PVE::Tools::run_command($cmd, outfunc => sub {}, errfunc => sub {}) };
+    if (my $err = $@) {
+        $self->log('err', $err);
+        $self->{errors} = 1;
+    }
+}
+
+sub phase3 {
+    my ($self, $vmid) = @_;
+
+    my $volids = $self->{volumes};
+    return if $self->{phase2errors};
+
+    # destroy local copies
+    foreach my $volid (@$volids) {
+       eval { PVE::Storage::vdisk_free($self->{storecfg}, $volid); };
+       if (my $err = $@) {
+           $self->log('err', "removing local copy of '$volid' failed - $err");
+           $self->{errors} = 1;
+           last if $err =~ /^interrupted by signal$/;
+       }
+    }
 }
+
+sub phase3_cleanup {
+    my ($self, $vmid, $err) = @_;
+
+    my $conf = $self->{vmconf};
+    return if $self->{phase2errors};
+
+    # move config to remote node
+    my $conffile = PVE::QemuServer::config_file($vmid);
+    my $newconffile = PVE::QemuServer::config_file($vmid, $self->{node});
+
+    die "Failed to move config to node '$self->{node}' - rename failed: $!\n"
+        if !rename($conffile, $newconffile);
+
+    if ($self->{livemigration}) {
+       # now that config file is move, we can resume vm on target if livemigrate
+       my $cmd = [@{$self->{rem_ssh}}, 'qm', 'resume', $vmid, '--skiplock'];
+       eval{ PVE::Tools::run_command($cmd, outfunc => sub {}, 
+               errfunc => sub {
+                   my $line = shift;
+                   $self->log('err', $line);
+               });
+       };
+       if (my $err = $@) {
+           $self->log('err', $err);
+           $self->{errors} = 1;
+       }
+    }
+
+    eval {
+
+       my $timer = 0;
+       if (PVE::QemuServer::vga_conf_has_spice($conf->{vga}) && $self->{running}) {
+           $self->log('info', "Waiting for spice server migration");
+           while (1) {
+               my $res = PVE::QemuServer::vm_mon_cmd_nocheck($vmid, 'query-spice');
+               last if int($res->{'migrated'}) == 1;
+               last if $timer > 50;
+               $timer ++;
+               usleep(200000);
+           }
+       }
+    };
+
+    # always stop local VM
+    eval { PVE::QemuServer::vm_stop($self->{storecfg}, $vmid, 1, 1); };
+    if (my $err = $@) {
+       $self->log('err', "stopping vm failed - $err");
+       $self->{errors} = 1;
+    }
+
+    if ($self->{tunnel}) {
+       eval { finish_tunnel($self, $self->{tunnel});  };
+       if (my $err = $@) {
+           $self->log('err', $err);
+           $self->{errors} = 1;
+       }
+    }
+
+    # always deactivate volumes - avoid lvm LVs to be active on several nodes
+    eval {
+       my $vollist = PVE::QemuServer::get_vm_volumes($conf);
+       PVE::Storage::deactivate_volumes($self->{storecfg}, $vollist);
+    };
+    if (my $err = $@) {
+       $self->log('err', $err);
+       $self->{errors} = 1;
+    }
+
+    # clear migrate lock
+    my $cmd = [ @{$self->{rem_ssh}}, 'qm', 'unlock', $vmid ];
+    $self->cmd_logerr($cmd, errmsg => "failed to clear migrate lock");
+}
+
+sub final_cleanup {
+    my ($self, $vmid) = @_;
+
+    # nothing to do
+}
+
+1;