update sources to v12.1.2

[ceph.git] / ceph / qa / tasks / ceph_manager.py
diff --git a/ceph/qa/tasks/ceph_manager.py b/ceph/qa/tasks/ceph_manager.py

index a40bd6c7bca7464164785de0cb31bf6bc618ddc4..b2f687e49bb2a89030d30a8286248f871402e3a3 100644 (file)
--- a/ceph/qa/tasks/ceph_manager.py
+++ b/ceph/qa/tasks/ceph_manager.py
@@ -125,6 +125,8 @@ class Thrasher:
          self.chance_thrash_cluster_full = self.config.get('chance_thrash_cluster_full', .05)
          self.chance_thrash_pg_upmap = self.config.get('chance_thrash_pg_upmap', 1.0)
          self.chance_thrash_pg_upmap_items = self.config.get('chance_thrash_pg_upmap', 1.0)
+        self.random_eio = self.config.get('random_eio')
+        self.chance_force_recovery = self.config.get('chance_force_recovery', 0.3)
  
          num_osds = self.in_osds + self.out_osds
          self.max_pgs = self.config.get("max_pgs_per_pool_osd", 1200) * num_osds
@@ -183,14 +185,9 @@ class Thrasher:
  
      def _set_config(self, service_type, service_id, name, value):
          opt_arg = '--{name} {value}'.format(name=name, value=value)
-        try:
-            whom = '.'.join([service_type, service_id])
-            self.ceph_manager.raw_cluster_cmd('--', 'tell', whom,
-                                              'injectargs', opt_arg)
-        except Exception:
-            self.ceph_manager.raw_cluster_cmd('--', service_type,
-                                              'tell', service_id,
-                                              'injectargs', opt_arg)
+        whom = '.'.join([service_type, service_id])
+        self.ceph_manager.raw_cluster_cmd('--', 'tell', whom,
+                                          'injectargs', opt_arg)
  
  
      def cmd_exists_on_osds(self, cmd):
@@ -440,6 +437,12 @@ class Thrasher:
              skip_admin_check=skip_admin_check)
          self.dead_osds.remove(osd)
          self.live_osds.append(osd)
+        if self.random_eio > 0 and osd is self.rerrosd:
+            self.ceph_manager.raw_cluster_cmd('tell', 'osd.'+str(self.rerrosd),
+                          'injectargs', '--', '--filestore_debug_random_read_err='+str(self.random_eio))
+            self.ceph_manager.raw_cluster_cmd('tell', 'osd.'+str(self.rerrosd),
+                          'injectargs', '--', '--bluestore_debug_random_read_err='+str(self.random_eio))
+
  
      def out_osd(self, osd=None):
          """
@@ -601,6 +604,39 @@ class Thrasher:
          except CommandFailedError:
              self.log('Failed to rm-pg-upmap-items, ignoring')
  
+    def force_recovery(self):
+        """
+        Force recovery on some of PGs
+        """
+        backfill = random.random() >= 0.5
+        j = self.ceph_manager.get_pgids_to_force(backfill)
+        if j:
+            if backfill:
+                self.ceph_manager.raw_cluster_cmd('pg', 'force-backfill', *j)
+            else:
+                self.ceph_manager.raw_cluster_cmd('pg', 'force-recovery', *j)
+
+    def cancel_force_recovery(self):
+        """
+        Force recovery on some of PGs
+        """
+        backfill = random.random() >= 0.5
+        j = self.ceph_manager.get_pgids_to_cancel_force(backfill)
+        if j:
+            if backfill:
+                self.ceph_manager.raw_cluster_cmd('pg', 'cancel-force-backfill', *j)
+            else:
+                self.ceph_manager.raw_cluster_cmd('pg', 'cancel-force-recovery', *j)
+
+    def force_cancel_recovery(self):
+        """
+        Force or cancel forcing recovery
+        """
+        if random.random() >= 0.4:
+           self.force_recovery()
+        else:
+           self.cancel_force_recovery()
+
      def all_up(self):
          """
          Make sure all osds are up and not out.
@@ -612,6 +648,17 @@ class Thrasher:
              self.log("inning osd")
              self.in_osd()
  
+    def all_up_in(self):
+        """
+        Make sure all osds are up and fully in.
+        """
+        self.all_up();
+        for osd in self.live_osds:
+            self.ceph_manager.raw_cluster_cmd('osd', 'reweight',
+                                              str(osd), str(1))
+            self.ceph_manager.raw_cluster_cmd('osd', 'primary-affinity',
+                                              str(osd), str(1))
+
      def do_join(self):
          """
          Break out of this Ceph loop
@@ -759,7 +806,7 @@ class Thrasher:
          while len(self.in_osds) < (self.minin + 1):
              self.in_osd()
          self.log("Waiting for recovery")
-        self.ceph_manager.wait_for_all_up(
+        self.ceph_manager.wait_for_all_osds_up(
              timeout=self.config.get('timeout')
              )
          # now we wait 20s for the pg status to change, if it takes longer,
@@ -828,6 +875,8 @@ class Thrasher:
              actions.append((self.thrash_pg_upmap, self.chance_thrash_pg_upmap,))
          if self.chance_thrash_pg_upmap_items > 0:
              actions.append((self.thrash_pg_upmap_items, self.chance_thrash_pg_upmap_items,))
+        if self.chance_force_recovery > 0:
+            actions.append((self.force_cancel_recovery, self.chance_force_recovery))
  
          for key in ['heartbeat_inject_failure', 'filestore_inject_stall']:
              for scenario in [
@@ -949,6 +998,12 @@ class Thrasher:
          scrubint = self.config.get("scrub_interval", -1)
          maxdead = self.config.get("max_dead", 0)
          delay = self.config.get("op_delay", 5)
+        self.rerrosd = self.live_osds[0]
+        if self.random_eio > 0:
+            self.ceph_manager.raw_cluster_cmd('tell', 'osd.'+str(self.rerrosd),
+                          'injectargs', '--', '--filestore_debug_random_read_err='+str(self.random_eio))
+            self.ceph_manager.raw_cluster_cmd('tell', 'osd.'+str(self.rerrosd),
+                          'injectargs', '--', '--bluestore_debug_random_read_err='+str(self.random_eio))
          self.log("starting do_thrash")
          while not self.stopping:
              to_log = [str(x) for x in ["in_osds: ", self.in_osds,
@@ -976,6 +1031,11 @@ class Thrasher:
                          Scrubber(self.ceph_manager, self.config)
              self.choose_action()()
              time.sleep(delay)
+        if self.random_eio > 0:
+            self.ceph_manager.raw_cluster_cmd('tell', 'osd.'+str(self.rerrosd),
+                          'injectargs', '--', '--filestore_debug_random_read_err=0.0')
+            self.ceph_manager.raw_cluster_cmd('tell', 'osd.'+str(self.rerrosd),
+                          'injectargs', '--', '--bluestore_debug_random_read_err=0.0')
          for pool in list(self.pools_to_fix_pgp_num):
              if self.ceph_manager.get_pool_pg_num(pool) > 0:
                  self.fix_pgp_num(pool)
@@ -983,7 +1043,7 @@ class Thrasher:
          for service, opt, saved_value in self.saved_options:
              self._set_config(service, '*', opt, saved_value)
          self.saved_options = []
-        self.all_up()
+        self.all_up_in()
  
  
  class ObjectStoreTool:
@@ -1050,6 +1110,7 @@ class ObjectStoreTool:
          finally:
              if self.do_revive:
                  self.manager.revive_osd(self.osd)
+                self.manager.wait_till_osd_is_up(self.osd, 300)
  
  
  class CephManager:
@@ -1153,6 +1214,47 @@ class CephManager:
                    "-w"],
              wait=False, stdout=StringIO(), stdin=run.PIPE)
  
+    def flush_pg_stats(self, osds, no_wait=None, wait_for_mon=300):
+        """
+        Flush pg stats from a list of OSD ids, ensuring they are reflected
+        all the way to the monitor.  Luminous and later only.
+
+        :param osds: list of OSDs to flush
+        :param no_wait: list of OSDs not to wait for seq id. by default, we
+                        wait for all specified osds, but some of them could be
+                        moved out of osdmap, so we cannot get their updated
+                        stat seq from monitor anymore. in that case, you need
+                        to pass a blacklist.
+        :param wait_for_mon: wait for mon to be synced with mgr. 0 to disable
+                             it. (5 min by default)
+        """
+        seq = {osd: self.raw_cluster_cmd('tell', 'osd.%d' % osd, 'flush_pg_stats')
+               for osd in osds}
+        if not wait_for_mon:
+            return
+        if no_wait is None:
+            no_wait = []
+        for osd, need in seq.iteritems():
+            if osd in no_wait:
+                continue
+            got = 0
+            while wait_for_mon > 0:
+                got = self.raw_cluster_cmd('osd', 'last-stat-seq', 'osd.%d' % osd)
+                self.log('need seq {need} got {got} for osd.{osd}'.format(
+                    need=need, got=got, osd=osd))
+                if got >= need:
+                    break
+                A_WHILE = 1
+                time.sleep(A_WHILE)
+                wait_for_mon -= A_WHILE
+            else:
+                raise Exception('timed out waiting for mon to be updated with '
+                                'osd.{osd}: {got} < {need}'.
+                                format(osd=osd, got=got, need=need))
+
+    def flush_all_pg_stats(self):
+        self.flush_pg_stats(range(len(self.get_osd_dump())))
+
      def do_rados(self, remote, cmd, check_status=True):
          """
          Execute a remote rados command.
@@ -1555,6 +1657,10 @@ class CephManager:
                      'osd', 'pool', 'set', pool_name,
                      'allow_ec_overwrites',
                      'true')
+            self.raw_cluster_cmd(
+                'osd', 'pool', 'application', 'enable',
+                pool_name, 'rados', '--yes-i-really-mean-it',
+                run.Raw('||'), 'true')
              self.pools[pool_name] = pg_num
          time.sleep(1)
  
@@ -1717,6 +1823,40 @@ class CephManager:
          j = json.loads('\n'.join(out.split('\n')[1:]))
          return j['pg_stats']
  
+    def get_pgids_to_force(self, backfill):
+        """
+        Return the randomized list of PGs that can have their recovery/backfill forced
+        """
+        j = self.get_pg_stats();
+        pgids = []
+        if backfill:
+            wanted = ['degraded', 'backfilling', 'backfill_wait']
+        else:
+            wanted = ['recovering', 'degraded', 'recovery_wait']
+        for pg in j:
+            status = pg['state'].split('+')
+            for t in wanted:
+                if random.random() > 0.5 and not ('forced_backfill' in status or 'forced_recovery' in status) and t in status:
+                    pgids.append(pg['pgid'])
+                    break
+        return pgids
+
+    def get_pgids_to_cancel_force(self, backfill):
+       """
+       Return the randomized list of PGs whose recovery/backfill priority is forced
+       """
+       j = self.get_pg_stats();
+       pgids = []
+       if backfill:
+           wanted = 'forced_backfill'
+       else:
+           wanted = 'forced_recovery'
+       for pg in j:
+           status = pg['state'].split('+')
+           if wanted in status and random.random() > 0.5:
+               pgids.append(pg['pgid'])
+       return pgids
+
      def compile_pg_status(self):
          """
          Return a histogram of pg state values
@@ -1849,6 +1989,10 @@ class CephManager:
          """
          return self.get_osd_dump_json()['osds']
  
+    def get_mgr_dump(self):
+        out = self.raw_cluster_cmd('mgr', 'dump', '--format=json')
+        return json.loads(out)
+
      def get_stuck_pgs(self, type_, threshold):
          """
          :returns: stuck pg information from the cluster
@@ -2007,7 +2151,7 @@ class CephManager:
          x = self.get_osd_dump()
          return (len(x) == sum([(y['up'] > 0) for y in x]))
  
-    def wait_for_all_up(self, timeout=None):
+    def wait_for_all_osds_up(self, timeout=None):
          """
          When this exits, either the timeout has expired, or all
          osds are up.
@@ -2017,10 +2161,45 @@ class CephManager:
          while not self.are_all_osds_up():
              if timeout is not None:
                  assert time.time() - start < timeout, \
-                    'timeout expired in wait_for_all_up'
+                    'timeout expired in wait_for_all_osds_up'
              time.sleep(3)
          self.log("all up!")
  
+    def pool_exists(self, pool):
+        if pool in self.list_pools():
+            return True
+        return False
+
+    def wait_for_pool(self, pool, timeout=300):
+        """
+        Wait for a pool to exist
+        """
+        self.log('waiting for pool %s to exist' % pool)
+        start = time.time()
+        while not self.pool_exists(pool):
+            if timeout is not None:
+                assert time.time() - start < timeout, \
+                    'timeout expired in wait_for_pool'
+            time.sleep(3)
+
+    def wait_for_pools(self, pools):
+        for pool in pools:
+            self.wait_for_pool(pool)
+
+    def is_mgr_available(self):
+        x = self.get_mgr_dump()
+        return x.get('available', False)
+
+    def wait_for_mgr_available(self, timeout=None):
+        self.log("waiting for mgr available")
+        start = time.time()
+        while not self.is_mgr_available():
+            if timeout is not None:
+                assert time.time() - start < timeout, \
+                    'timeout expired in wait_for_mgr_available'
+            time.sleep(3)
+        self.log("mgr available!")
+
      def wait_for_recovery(self, timeout=None):
          """
          Check peering. When this exists, we have recovered.
@@ -2273,6 +2452,20 @@ class CephManager:
              self.make_admin_daemon_dir(remote)
          self.ctx.daemons.get_daemon('mon', mon, self.cluster).restart()
  
+    def revive_mgr(self, mgr):
+        """
+        Restart by either power cycling (if the config says so),
+        or by doing a normal restart.
+        """
+        if self.config.get('powercycle'):
+            remote = self.find_remote('mgr', mgr)
+            self.log('revive_mgr on mgr.{m} doing powercycle of {s}'.
+                     format(m=mgr, s=remote.name))
+            self._assert_ipmi(remote)
+            remote.console.power_on()
+            self.make_admin_daemon_dir(remote)
+        self.ctx.daemons.get_daemon('mgr', mgr, self.cluster).restart()
+
      def get_mon_status(self, mon):
          """
          Extract all the monitor status information from the cluster
@@ -2364,5 +2557,8 @@ kill_mon = utility_task("kill_mon")
  create_pool = utility_task("create_pool")
  remove_pool = utility_task("remove_pool")
  wait_for_clean = utility_task("wait_for_clean")
+flush_all_pg_stats = utility_task("flush_all_pg_stats")
  set_pool_property = utility_task("set_pool_property")
  do_pg_scrub = utility_task("do_pg_scrub")
+wait_for_pool = utility_task("wait_for_pool")
+wait_for_pools = utility_task("wait_for_pools")