]> git.proxmox.com Git - qemu-server.git/blobdiff - PVE/QemuMigrate.pm
migrate: tolerate query-migrate errors
[qemu-server.git] / PVE / QemuMigrate.pm
index 90d3ac18a937c6611e8c79b4376316a5ba82e3e3..0ad0eab4a26a5067712865831ccc84ce578858fe 100644 (file)
@@ -2,66 +2,19 @@ package PVE::QemuMigrate;
 
 use strict;
 use warnings;
-use POSIX qw(strftime);
+use PVE::AbstractMigrate;
 use IO::File;
 use IPC::Open2;
-use PVE::Tools qw(run_command);
 use PVE::INotify;
 use PVE::Cluster;
 use PVE::Storage;
 use PVE::QemuServer;
+use Time::HiRes qw( usleep );
 
-my $delayed_interrupt = 0;
-
-# blowfish is a fast block cipher, much faster then 3des
-my @ssh_opts = ('-c', 'blowfish', '-o', 'BatchMode=yes');
-my @ssh_cmd = ('/usr/bin/ssh', @ssh_opts);
-my @scp_cmd = ('/usr/bin/scp', @ssh_opts);
-my $qm_cmd = '/usr/sbin/qm';
-
-sub logmsg {
-    my ($level, $msg) = @_;
-
-    chomp $msg;
-
-    return if !$msg;
-
-    my $tstr = strftime("%b %d %H:%M:%S", localtime);
-
-    foreach my $line (split (/\n/, $msg)) {
-       if ($level eq 'err') {
-           print STDOUT "$tstr ERROR: $line\n";
-       } else {
-           print STDOUT "$tstr $line\n";
-       }
-    }
-    \*STDOUT->flush();
-}
-
-sub eval_int {
-    my ($func) = @_;
-
-    eval {
-       local $SIG{INT} = $SIG{TERM} = $SIG{QUIT} = $SIG{HUP} = sub {
-           $delayed_interrupt = 0;
-           die "interrupted by signal\n";
-       };
-       local $SIG{PIPE} = sub {
-           $delayed_interrupt = 0;
-           die "interrupted by signal\n";
-       };
-
-       my $di = $delayed_interrupt;
-       $delayed_interrupt = 0;
-
-       die "interrupted by signal\n" if $di;
-
-       &$func();
-    };
-}
+use base qw(PVE::AbstractMigrate);
 
 sub fork_command_pipe {
-    my ($cmd) = @_;
+    my ($self, $cmd) = @_;
 
     my $reader = IO::File->new();
     my $writer = IO::File->new();
@@ -76,7 +29,7 @@ sub fork_command_pipe {
 
     # catch exec errors
     if ($orig_pid != $$) {
-       logmsg('err', "can't fork command pipe\n");
+       $self->log('err', "can't fork command pipe\n");
        POSIX::_exit(1);
        kill('KILL', $$);
     }
@@ -87,7 +40,7 @@ sub fork_command_pipe {
 }
 
 sub finish_command_pipe {
-    my $cmdpipe = shift;
+    my ($self, $cmdpipe, $timeout) = @_;
 
     my $writer = $cmdpipe->{writer};
     my $reader = $cmdpipe->{reader};
@@ -97,59 +50,40 @@ sub finish_command_pipe {
 
     my $cpid = $cmdpipe->{pid};
 
-    kill(15, $cpid) if kill(0, $cpid);
-
-    waitpid($cpid, 0);
-}
-
-sub run_with_timeout {
-    my ($timeout, $code, @param) = @_;
-
-    die "got timeout\n" if $timeout <= 0;
-
-    my $prev_alarm;
-
-    my $sigcount = 0;
-
-    my $res;
-
-    eval {
-       local $SIG{ALRM} = sub { $sigcount++; die "got timeout\n"; };
-       local $SIG{PIPE} = sub { $sigcount++; die "broken pipe\n" };
-       local $SIG{__DIE__};   # see SA bug 4631
-
-       $prev_alarm = alarm($timeout);
-
-       $res = &$code(@param);
-
-       alarm(0); # avoid race conditions
-    };
-
-    my $err = $@;
-
-    alarm($prev_alarm) if defined($prev_alarm);
+    if ($timeout) {
+       for (my $i = 0; $i < $timeout; $i++) {
+           return if !PVE::ProcFSTools::check_process_running($cpid);
+           sleep(1);
+       }
+    }
 
-    die "unknown error" if $sigcount && !$err; # seems to happen sometimes
+    $self->log('info', "ssh tunnel still running - terminating now with SIGTERM\n");
+    kill(15, $cpid);
 
-    die $err if $err;
+    # wait again
+    for (my $i = 0; $i < 10; $i++) {
+       return if !PVE::ProcFSTools::check_process_running($cpid);
+       sleep(1);
+    }
 
-    return $res;
+    $self->log('info', "ssh tunnel still running - terminating now with SIGKILL\n");
+    kill 9, $cpid;
+    sleep 1;
 }
 
 sub fork_tunnel {
-    my ($nodeip, $lport, $rport) = @_;
+    my ($self, $nodeip, $lport, $rport) = @_;
 
-    my $cmd = [@ssh_cmd, '-o', 'BatchMode=yes',
-              '-L', "$lport:localhost:$rport", $nodeip,
+    my $cmd = [@{$self->{rem_ssh}}, '-L', "$lport:localhost:$rport",
               'qm', 'mtunnel' ];
 
-    my $tunnel = fork_command_pipe($cmd);
+    my $tunnel = $self->fork_command_pipe($cmd);
 
     my $reader = $tunnel->{reader};
 
     my $helo;
     eval {
-       run_with_timeout(60, sub { $helo = <$reader>; });
+       PVE::Tools::run_with_timeout(60, sub { $helo = <$reader>; });
        die "no reply\n" if !$helo;
        die "no quorum on target node\n" if $helo =~ m/^no quorum$/;
        die "got strange reply from mtunnel ('$helo')\n"
@@ -158,205 +92,84 @@ sub fork_tunnel {
     my $err = $@;
 
     if ($err) {
-       finish_command_pipe($tunnel);
+       $self->finish_command_pipe($tunnel);
        die "can't open migration tunnel - $err";
     }
     return $tunnel;
 }
 
 sub finish_tunnel {
-    my $tunnel = shift;
+    my ($self, $tunnel) = @_;
 
     my $writer = $tunnel->{writer};
 
     eval {
-       run_with_timeout(30, sub {
+       PVE::Tools::run_with_timeout(30, sub {
            print $writer "quit\n";
            $writer->flush();
        });
     };
     my $err = $@;
 
-    finish_command_pipe($tunnel);
+    $self->finish_command_pipe($tunnel, 30);
 
     die $err if $err;
 }
 
-sub migrate {
-    my ($node, $nodeip, $vmid, $online, $force) = @_;
-
-    my $starttime = time();
-
-    my $rem_ssh = [@ssh_cmd, "root\@$nodeip"];
-
-    local $SIG{INT} = $SIG{TERM} = $SIG{QUIT} = $SIG{HUP} = $SIG{PIPE} = sub {
-       logmsg('err', "received interrupt - delayed");
-       $delayed_interrupt = 1;
-    };
+sub lock_vm {
+    my ($self, $vmid, $code, @param) = @_;
 
-    local $ENV{RSYNC_RSH} = join(' ', @ssh_cmd);
-
-    my $session = {
-       vmid => $vmid,
-       node => $node,
-       nodeip => $nodeip,
-       force => $force,
-       storecfg => PVE::Storage::config(),
-       rem_ssh => $rem_ssh,
-    };
-    
-    my $errors;
-
-    # lock config during migration
-    eval { PVE::QemuServer::lock_config($vmid, sub {
-
-       my $conf;
-       eval_int(sub { $conf = prepare($session); });
-       die $@ if $@;
-
-       my $running = 0;
-       if (my $pid = PVE::QemuServer::check_running($vmid)) {
-           die "cant migrate running VM without --online\n" if !$online;
-           $running = $pid;
-       }
-
-       my $rhash = {};
-       eval_int (sub { phase1($session, $conf, $rhash, $running); });
-       my $err = $@;
-
-       if ($err) {
-           if ($rhash->{clearlock}) {
-               my $unset = { lock => 1 };
-               eval { PVE::QemuServer::change_config_nolock($session->{vmid}, {}, $unset, 1) };
-               if (my $tmperr = $@) {
-                   logmsg('err', $tmperr);
-               }
-           }
-           if ($rhash->{volumes}) {
-               foreach my $volid (@{$rhash->{volumes}}) {
-                   logmsg('err', "found stale volume copy '$volid' on node '$session->{node}'");
-               }
-           }
-           die $err;
-       }
-
-       # vm is now owned by other node
-       # Note: there is no VM config file on the local node anymore, so 
-       # we need to pass $nocheck = 1 for vm commands
-
-       my $volids = $rhash->{volumes};
-
-       if ($running) {
-
-           $rhash = {};
-           eval_int(sub { phase2($session, $conf, $rhash); });
-           my $err = $@;
-
-           # always kill tunnel
-           if ($rhash->{tunnel}) {
-               eval_int(sub { finish_tunnel($rhash->{tunnel}) });
-               if (my $tmperr = $@) {
-                   logmsg('err', "stopping tunnel failed - $tmperr");
-                   $errors = 1;
-               }
-           }
-
-           # always stop local VM - no interrupts possible
-           eval { PVE::QemuServer::vm_stop($session->{storecfg}, $session->{vmid}, 1, 1); };
-           if (my $tmperr = $@) {
-               logmsg('err', "stopping vm failed - $tmperr");
-               $errors = 1;
-           }
-
-           if ($err) {
-               $errors = 1;
-               logmsg('err', "online migrate failure - $err");
-           }
-       }
-
-       # finalize -- clear migrate lock
-       eval_int(sub {
-           my $cmd = [ @{$session->{rem_ssh}}, $qm_cmd, 'unlock', $session->{vmid} ];
-           run_command($cmd);
-       });
-       if (my $tmperr = $@) {
-           logmsg('err', "failed to clear migrate lock - $tmperr");
-           $errors = 1;
-       }
-
-       # destroy local copies
-       foreach my $volid (@$volids) {
-           eval_int(sub { PVE::Storage::vdisk_free($session->{storecfg}, $volid); });
-           my $err = $@;
-
-           if ($err) {
-               logmsg('err', "removing local copy of '$volid' failed - $err");
-               $errors = 1;
-
-               last if $err =~ /^interrupted by signal$/;
-           }
-       }
+    return PVE::QemuServer::lock_config($vmid, $code, @param);
+}
 
-       # always deactivate volumes - avoid lvm LVs to be active on 
-       # several nodes
-       eval {
-           my $vollist = PVE::QemuServer::get_vm_volumes($conf);
-           PVE::Storage::deactivate_volumes($session->{storecfg}, $vollist);
-       };
-       if (my $tmperr = $@) {
-           logmsg('err', $tmperr);
-           $errors = 1;
-       }
+sub prepare {
+    my ($self, $vmid) = @_;
 
-    })};
+    my $online = $self->{opts}->{online};
 
-    my $err = $@;
+    $self->{storecfg} = PVE::Storage::config();
 
-    my $delay = time() - $starttime;
-    my $mins = int($delay/60);
-    my $secs = $delay - $mins*60;
-    my $hours =  int($mins/60);
-    $mins = $mins - $hours*60;
+    # test is VM exist
+    my $conf = $self->{vmconf} = PVE::QemuServer::load_config($vmid);
 
-    my $duration = sprintf "%02d:%02d:%02d", $hours, $mins, $secs;
+    PVE::QemuServer::check_lock($conf);
 
-    if ($err) {
-       logmsg('err', "migration aborted (duration $duration): $err");
-       die "migration aborted";
+    my $running = 0;
+    if (my $pid = PVE::QemuServer::check_running($vmid)) {
+       die "cant migrate running VM without --online\n" if !$online;
+       $running = $pid;
     }
 
-    if ($errors) {
-       logmsg('err', "migration finished with problems (duration $duration)");
-       die "migration problems"
+    if (my $loc_res = PVE::QemuServer::check_local_resources($conf, 1)) {
+       if ($self->{running} || !$self->{opts}->{force}) {
+           die "can't migrate VM which uses local devices\n";
+       } else {
+           $self->log('info', "migrating VM which uses local devices");
+       }
     }
 
-    logmsg('info', "migration finished successfuly (duration $duration)");
-}
-
-sub prepare {
-    my ($session) = @_;
-
-    # test is VM exist
-    my $conf = PVE::QemuServer::load_config($session->{vmid});
-
-    PVE::QemuServer::check_lock($conf);
-
     # activate volumes
     my $vollist = PVE::QemuServer::get_vm_volumes($conf);
-    PVE::Storage::activate_volumes($session->{storecfg}, $vollist);
+    PVE::Storage::activate_volumes($self->{storecfg}, $vollist);
+
+    # fixme: check if storage is available on both nodes
 
     # test ssh connection
-    my $cmd = [ @{$session->{rem_ssh}}, '/bin/true' ];
-    eval { run_command($cmd); };
+    my $cmd = [ @{$self->{rem_ssh}}, '/bin/true' ];
+    eval { $self->cmd_quiet($cmd); };
     die "Can't connect to destination address using public key\n" if $@;
 
-    return $conf;
+    return $running;
 }
 
 sub sync_disks {
-    my ($session, $conf, $rhash, $running) = @_;
+    my ($self, $vmid) = @_;
+
+    $self->log('info', "copying disk images");
+
+    my $conf = $self->{vmconf};
 
-    logmsg('info', "copying disk images");
+    $self->{volumes} = [];
 
     my $res = [];
 
@@ -365,17 +178,23 @@ sub sync_disks {
        my $volhash = {};
        my $cdromhash = {};
 
-       # get list from PVE::Storage (for unused volumes)
-       my $dl = PVE::Storage::vdisk_list($session->{storecfg}, undef, $session->{vmid});
-       PVE::Storage::foreach_volid($dl, sub {
-           my ($volid, $sid, $volname) = @_;
+       my @sids = PVE::Storage::storage_ids($self->{storecfg});
+        foreach my $storeid (@sids) {
+           my $scfg = PVE::Storage::storage_config($self->{storecfg}, $storeid);
+            next if $scfg->{shared};
+           next if !PVE::Storage::storage_check_enabled($self->{storecfg}, $storeid, undef, 1);
 
-           my $scfg =  PVE::Storage::storage_config($session->{storecfg}, $sid);
+            # get list from PVE::Storage (for unused volumes)
+            my $dl = PVE::Storage::vdisk_list($self->{storecfg}, $storeid, $vmid);
+            PVE::Storage::foreach_volid($dl, sub {
+                my ($volid, $sid, $volname) = @_;
 
-           return if $scfg->{shared};
+                # check if storage is available on target node
+                PVE::Storage::storage_check_node($self->{storecfg}, $sid, $self->{node});
 
-           $volhash->{$volid} = 1;
-       });
+                $volhash->{$volid} = 1;
+            });
+        }
 
        # and add used,owned/non-shared disks (just to be sure we have all)
 
@@ -396,7 +215,9 @@ sub sync_disks {
 
            my ($sid, $volname) = PVE::Storage::parse_volume_id($volid);
 
-           my $scfg =  PVE::Storage::storage_config($session->{storecfg}, $sid);
+           # check if storage is available on both nodes
+           my $scfg = PVE::Storage::storage_check_node($self->{storecfg}, $sid);
+           PVE::Storage::storage_check_node($self->{storecfg}, $sid, $self->{node});
 
            return if $scfg->{shared};
 
@@ -404,22 +225,22 @@ sub sync_disks {
 
            $sharedvm = 0;
 
-           my ($path, $owner) = PVE::Storage::path($session->{storecfg}, $volid);
+           my ($path, $owner) = PVE::Storage::path($self->{storecfg}, $volid);
 
            die "can't migrate volume '$volid' - owned by other VM (owner = VM $owner)\n"
-               if !$owner || ($owner != $session->{vmid});
+               if !$owner || ($owner != $self->{vmid});
 
            $volhash->{$volid} = 1;
        });
 
-       if ($running && !$sharedvm) {
+       if ($self->{running} && !$sharedvm) {
            die "can't do online migration - VM uses local disks\n";
        }
 
        # do some checks first
        foreach my $volid (keys %$volhash) {
            my ($sid, $volname) = PVE::Storage::parse_volume_id($volid);
-           my $scfg =  PVE::Storage::storage_config($session->{storecfg}, $sid);
+           my $scfg =  PVE::Storage::storage_config($self->{storecfg}, $sid);
 
            die "can't migrate '$volid' - storagy type '$scfg->{type}' not supported\n"
                if $scfg->{type} ne 'dir';
@@ -427,112 +248,272 @@ sub sync_disks {
 
        foreach my $volid (keys %$volhash) {
            my ($sid, $volname) = PVE::Storage::parse_volume_id($volid);
-           push @{$rhash->{volumes}}, $volid;
-           PVE::Storage::storage_migrate($session->{storecfg}, $volid, $session->{nodeip}, $sid);
+           push @{$self->{volumes}}, $volid;
+           PVE::Storage::storage_migrate($self->{storecfg}, $volid, $self->{nodeip}, $sid);
        }
     };
     die "Failed to sync data - $@" if $@;
 }
 
 sub phase1 {
-    my ($session, $conf, $rhash, $running) = @_;
+    my ($self, $vmid) = @_;
 
-    logmsg('info', "starting migration of VM $session->{vmid} to node '$session->{node}' ($session->{nodeip})");
+    $self->log('info', "starting migration of VM $vmid to node '$self->{node}' ($self->{nodeip})");
 
-    if (my $loc_res = PVE::QemuServer::check_local_resources($conf, 1)) {
-       if ($running || !$session->{force}) {
-           die "can't migrate VM which uses local devices\n";
-       } else {
-           logmsg('info', "migrating VM which uses local devices");
-       }
-    }
+    my $conf = $self->{vmconf};
 
     # set migrate lock in config file
-    $rhash->{clearlock} = 1;
+    $conf->{lock} = 'migrate';
+    PVE::QemuServer::update_config_nolock($vmid, $conf, 1);
 
-    PVE::QemuServer::change_config_nolock($session->{vmid}, { lock => 'migrate' }, {}, 1);
+    sync_disks($self, $vmid);
 
-    sync_disks($session, $conf, $rhash, $running);
+};
 
-    # move config to remote node
-    my $conffile = PVE::QemuServer::config_file($session->{vmid});
-    my $newconffile = PVE::QemuServer::config_file($session->{vmid}, $session->{node});
+sub phase1_cleanup {
+    my ($self, $vmid, $err) = @_;
 
-    die "Failed to move config to node '$session->{node}' - rename failed: $!\n"
-       if !rename($conffile, $newconffile);
-};
+    $self->log('info', "aborting phase 1 - cleanup resources");
+
+    my $conf = $self->{vmconf};
+    delete $conf->{lock};
+    eval { PVE::QemuServer::update_config_nolock($vmid, $conf, 1) };
+    if (my $err = $@) {
+       $self->log('err', $err);
+    }
+
+    if ($self->{volumes}) {
+       foreach my $volid (@{$self->{volumes}}) {
+           $self->log('err', "found stale volume copy '$volid' on node '$self->{node}'");
+           # fixme: try to remove ?
+       }
+    }
+}
 
 sub phase2 {
-    my ($session, $conf, $rhash) = @_;
+    my ($self, $vmid) = @_;
 
-    logmsg('info', "starting VM on remote node '$session->{node}'");
+    my $conf = $self->{vmconf};
+
+    $self->log('info', "starting VM $vmid on remote node '$self->{node}'");
 
     my $rport;
 
+    my $nodename = PVE::INotify::nodename();
+
     ## start on remote node
-    my $cmd = [@{$session->{rem_ssh}}, $qm_cmd, 'start', 
-              $session->{vmid}, '--stateuri', 'tcp', '--skiplock'];
+    my $cmd = [@{$self->{rem_ssh}}, 'qm', 'start',
+               $vmid, '--stateuri', 'tcp', '--skiplock', '--migratedfrom', $nodename];
 
-    run_command($cmd, outfunc => sub {
+    PVE::Tools::run_command($cmd, outfunc => sub {
        my $line = shift;
 
        if ($line =~ m/^migration listens on port (\d+)$/) {
            $rport = $1;
        }
-    });
+    }, errfunc => sub {});
 
     die "unable to detect remote migration port\n" if !$rport;
 
-    logmsg('info', "starting migration tunnel");
+    $self->log('info', "starting migration tunnel");
 
     ## create tunnel to remote port
     my $lport = PVE::QemuServer::next_migrate_port();
-    $rhash->{tunnel} = fork_tunnel($session->{nodeip}, $lport, $rport);
+    $self->{tunnel} = $self->fork_tunnel($self->{nodeip}, $lport, $rport);
 
-    logmsg('info', "starting online/live migration");
+    $self->log('info', "starting online/live migration on port $lport");
     # start migration
 
     my $start = time();
 
-    PVE::QemuServer::vm_monitor_command($session->{vmid}, "migrate -d \"tcp:localhost:$lport\"", 1);
+    my $capabilities = {};
+    $capabilities->{capability} =  "xbzrle";
+    $capabilities->{state} = JSON::true;
 
-    my $lstat = '';
+    eval {
+       PVE::QemuServer::vm_mon_cmd_nocheck($vmid, "migrate-set-capabilities", capabilities => [$capabilities]);
+    };
+
+    #set cachesize 10% of the total memory
+    my $cachesize = int($conf->{memory}*1048576/10);
+    eval {
+       PVE::QemuServer::vm_mon_cmd_nocheck($vmid, "migrate-set-cache-size", value => $cachesize);
+    };
+
+    eval {
+        PVE::QemuServer::vm_mon_cmd_nocheck($vmid, "migrate", uri => "tcp:localhost:$lport");
+    };
+    my $merr = $@;
+
+    my $lstat = 0;
+    my $usleep = 2000000;
+    my $i = 0;
+    my $err_count = 0;
     while (1) {
-       sleep (2);
-       my $stat = PVE::QemuServer::vm_monitor_command($session->{vmid}, "info migrate", 1);
-       if ($stat =~ m/^Migration status: (active|completed|failed|cancelled)$/im) {
-           my $ms = $1;
-
-           if ($stat ne $lstat) {
-               if ($ms eq 'active') {
-                   my ($trans, $rem, $total) = (0, 0, 0);
-                   $trans = $1 if $stat =~ m/^transferred ram: (\d+) kbytes$/im;
-                   $rem = $1 if $stat =~ m/^remaining ram: (\d+) kbytes$/im;
-                   $total = $1 if $stat =~ m/^total ram: (\d+) kbytes$/im;
-
-                   logmsg('info', "migration status: $ms (transferred ${trans}KB, " .
-                           "remaining ${rem}KB), total ${total}KB)");
-               } else {
-                   logmsg('info', "migration status: $ms");
-               }
-           }
+       $i++;
+       my $avglstat = $lstat/$i if $lstat;
 
-           if ($ms eq 'completed') {
+       usleep($usleep);
+       my $stat;
+       eval {
+           $stat = PVE::QemuServer::vm_mon_cmd_nocheck($vmid, "query-migrate");
+       };
+       if (my $err = $@) {
+           $err_count++;
+           warn "query migrate failed: $err\n";
+           if ($err_count <= 5) {
+               usleep(1000000);
+               next;
+           }
+           die "too many query migrate failures - aborting\n";
+       }
+       if ($stat->{status} =~ m/^(active|completed|failed|cancelled)$/im) {
+           $merr = undef;
+           $err_count = 0;
+           if ($stat->{status} eq 'completed') {
                my $delay = time() - $start;
                if ($delay > 0) {
                    my $mbps = sprintf "%.2f", $conf->{memory}/$delay;
-                   logmsg('info', "migration speed: $mbps MB/s");
+                   $self->log('info', "migration speed: $mbps MB/s");
                }
            }
 
-           if ($ms eq 'failed' || $ms eq 'cancelled') {
+           if ($stat->{status} eq 'failed' || $stat->{status} eq 'cancelled') {
                die "aborting\n"
            }
 
-           last if $ms ne 'active';
+           if ($stat->{status} ne 'active') {
+               $self->log('info', "migration status: $stat->{status}");
+               last;
+           }
+
+           if ($stat->{ram}->{transferred} ne $lstat) {
+               my $trans = $stat->{ram}->{transferred} || 0;
+               my $rem = $stat->{ram}->{remaining} || 0;
+               my $total = $stat->{ram}->{total} || 0;
+               my $xbzrlecachesize = $stat->{"xbzrle-cache"}->{"cache-size"} || 0;
+               my $xbzrlebytes = $stat->{"xbzrle-cache"}->{"bytes"} || 0;
+               my $xbzrlepages = $stat->{"xbzrle-cache"}->{"pages"} || 0;
+               my $xbzrlecachemiss = $stat->{"xbzrle-cache"}->{"cache-miss"} || 0;
+               my $xbzrleoverflow = $stat->{"xbzrle-cache"}->{"overflow"} || 0;
+               #reduce sleep if remainig memory if lower than the everage transfert 
+               $usleep = 300000 if $rem < $avglstat;
+
+               $self->log('info', "migration status: $stat->{status} (transferred ${trans}, " .
+                          "remaining ${rem}), total ${total})");
+
+               $self->log('info', "migration xbzrle cachesize: ${xbzrlecachesize} transferred ${xbzrlebytes} pages ${xbzrlepages} cachemiss ${xbzrlecachemiss} overflow ${xbzrleoverflow}");
+           }
+
+           $lstat = $stat->{ram}->{transferred};
+           
        } else {
-           die "unable to parse migration status '$stat' - aborting\n";
+           die $merr if $merr;
+           die "unable to parse migration status '$stat->{status}' - aborting\n";
+       }
+    }
+}
+
+sub phase2_cleanup {
+    my ($self, $vmid, $err) = @_;
+
+    return if !$self->{errors};
+    $self->{phase2errors} = 1;
+
+    $self->log('info', "aborting phase 2 - cleanup resources");
+
+    my $conf = $self->{vmconf};
+    delete $conf->{lock};
+    eval { PVE::QemuServer::update_config_nolock($vmid, $conf, 1) };
+    if (my $err = $@) {
+        $self->log('err', $err);
+    }
+
+    # cleanup ressources on target host
+    my $nodename = PVE::INotify::nodename();
+    my $cmd = [@{$self->{rem_ssh}}, 'qm', 'stop', $vmid, '--skiplock', '--migratedfrom', $nodename];
+    eval{ PVE::Tools::run_command($cmd, outfunc => sub {}, errfunc => sub {}) };
+    if (my $err = $@) {
+        $self->log('err', $err);
+        $self->{errors} = 1;
+    }
+}
+
+sub phase3 {
+    my ($self, $vmid) = @_;
+
+    my $volids = $self->{volumes};
+    return if $self->{phase2errors};
+
+    # destroy local copies
+    foreach my $volid (@$volids) {
+       eval { PVE::Storage::vdisk_free($self->{storecfg}, $volid); };
+       if (my $err = $@) {
+           $self->log('err', "removing local copy of '$volid' failed - $err");
+           $self->{errors} = 1;
+           last if $err =~ /^interrupted by signal$/;
        }
-       $lstat = $stat;
+    }
+}
+
+sub phase3_cleanup {
+    my ($self, $vmid, $err) = @_;
+
+    my $conf = $self->{vmconf};
+    return if $self->{phase2errors};
+
+    # move config to remote node
+    my $conffile = PVE::QemuServer::config_file($vmid);
+    my $newconffile = PVE::QemuServer::config_file($vmid, $self->{node});
+
+    die "Failed to move config to node '$self->{node}' - rename failed: $!\n"
+        if !rename($conffile, $newconffile);
+
+    # now that config file is move, we can resume vm on target if livemigrate
+    if ($self->{tunnel}) {
+       my $cmd = [@{$self->{rem_ssh}}, 'qm', 'resume', $vmid, '--skiplock'];
+       eval{ PVE::Tools::run_command($cmd, outfunc => sub {}, errfunc => sub {}) };
+       if (my $err = $@) {
+           $self->log('err', $err);
+           $self->{errors} = 1;
+       }
+    }
+
+    # always stop local VM
+    eval { PVE::QemuServer::vm_stop($self->{storecfg}, $vmid, 1, 1); };
+    if (my $err = $@) {
+       $self->log('err', "stopping vm failed - $err");
+       $self->{errors} = 1;
+    }
+
+    if ($self->{tunnel}) {
+       eval { finish_tunnel($self, $self->{tunnel});  };
+       if (my $err = $@) {
+           $self->log('err', $err);
+           $self->{errors} = 1;
+       }
+    }
+
+    # always deactivate volumes - avoid lvm LVs to be active on several nodes
+    eval {
+       my $vollist = PVE::QemuServer::get_vm_volumes($conf);
+       PVE::Storage::deactivate_volumes($self->{storecfg}, $vollist);
     };
+    if (my $err = $@) {
+       $self->log('err', $err);
+       $self->{errors} = 1;
+    }
+
+    # clear migrate lock
+    my $cmd = [ @{$self->{rem_ssh}}, 'qm', 'unlock', $vmid ];
+    $self->cmd_logerr($cmd, errmsg => "failed to clear migrate lock");
 }
+
+sub final_cleanup {
+    my ($self, $vmid) = @_;
+
+    # nothing to do
+}
+
+1;