]> git.proxmox.com Git - mirror_zfs.git/blobdiff - cmd/ztest/ztest.c
Implement zfs_ioc_recv_new() for OpenZFS 2605
[mirror_zfs.git] / cmd / ztest / ztest.c
index 0a0fa7f490a86864b9ad4241f4004b25b4c6bd6e..ad15dea1d543ac60452a9b4f38c7549411e44c30 100644 (file)
@@ -20,7 +20,7 @@
  */
 /*
  * Copyright (c) 2005, 2010, Oracle and/or its affiliates. All rights reserved.
- * Copyright (c) 2011, 2014 by Delphix. All rights reserved.
+ * Copyright (c) 2011, 2015 by Delphix. All rights reserved.
  * Copyright 2011 Nexenta Systems, Inc.  All rights reserved.
  * Copyright (c) 2013 Steven Hartland. All rights reserved.
  */
@@ -52,7 +52,7 @@
  *     At random times, the child self-immolates with a SIGKILL.
  *     This is the software equivalent of pulling the power cord.
  *     The parent then runs the test again, using the existing
- *     storage pool, as many times as desired. If backwards compatability
+ *     storage pool, as many times as desired. If backwards compatibility
  *     testing is enabled ztest will sometimes run the "older" version
  *     of ztest after a SIGKILL.
  *
 #include <sys/zio.h>
 #include <sys/zil.h>
 #include <sys/zil_impl.h>
+#include <sys/zfs_rlock.h>
 #include <sys/vdev_impl.h>
 #include <sys/vdev_file.h>
 #include <sys/spa_impl.h>
 #include <unistd.h>
 #include <signal.h>
 #include <umem.h>
-#include <dlfcn.h>
 #include <ctype.h>
 #include <math.h>
 #include <sys/fs/zfs.h>
+#include <zfs_fletcher.h>
 #include <libnvpair.h>
+#ifdef __GLIBC__
+#include <execinfo.h> /* for backtrace() */
+#endif
 
 static int ztest_fd_data = -1;
 static int ztest_fd_rand = -1;
@@ -173,7 +177,7 @@ static const ztest_shared_opts_t ztest_opts_defaults = {
        .zo_mirrors = 2,
        .zo_raidz = 4,
        .zo_raidz_parity = 1,
-       .zo_vdev_size = SPA_MINDEVSIZE,
+       .zo_vdev_size = SPA_MINDEVSIZE * 2,
        .zo_datasets = 7,
        .zo_threads = 23,
        .zo_passtime = 60,              /* 60 seconds */
@@ -217,6 +221,7 @@ typedef struct ztest_block_tag {
        uint64_t        bt_magic;
        uint64_t        bt_objset;
        uint64_t        bt_object;
+       uint64_t        bt_dnodesize;
        uint64_t        bt_offset;
        uint64_t        bt_gen;
        uint64_t        bt_txg;
@@ -229,15 +234,6 @@ typedef struct bufwad {
        uint64_t        bw_data;
 } bufwad_t;
 
-/*
- * XXX -- fix zfs range locks to be generic so we can use them here.
- */
-typedef enum {
-       RL_READER,
-       RL_WRITER,
-       RL_APPEND
-} rl_type_t;
-
 typedef struct rll {
        void            *rll_writer;
        int             rll_readers;
@@ -245,12 +241,10 @@ typedef struct rll {
        kcondvar_t      rll_cv;
 } rll_t;
 
-typedef struct rl {
-       uint64_t        rl_object;
-       uint64_t        rl_offset;
-       uint64_t        rl_size;
-       rll_t           *rl_lock;
-} rl_t;
+typedef struct zll {
+       list_t z_list;
+       kmutex_t z_lock;
+} zll_t;
 
 #define        ZTEST_RANGE_LOCKS       64
 #define        ZTEST_OBJECT_LOCKS      64
@@ -265,6 +259,7 @@ typedef struct ztest_od {
        dmu_object_type_t od_crtype;
        uint64_t        od_blocksize;
        uint64_t        od_crblocksize;
+       uint64_t        od_crdnodesize;
        uint64_t        od_gen;
        uint64_t        od_crgen;
        char            od_name[MAXNAMELEN];
@@ -282,7 +277,7 @@ typedef struct ztest_ds {
        char            zd_name[MAXNAMELEN];
        kmutex_t        zd_dirobj_lock;
        rll_t           zd_object_lock[ZTEST_OBJECT_LOCKS];
-       rll_t           zd_range_lock[ZTEST_RANGE_LOCKS];
+       zll_t           zd_range_lock[ZTEST_RANGE_LOCKS];
 } ztest_ds_t;
 
 /*
@@ -294,6 +289,7 @@ typedef struct ztest_info {
        ztest_func_t    *zi_func;       /* test function */
        uint64_t        zi_iters;       /* iterations per execution */
        uint64_t        *zi_interval;   /* execute every <interval> seconds */
+       const char      *zi_funcname;   /* name of test function */
 } ztest_info_t;
 
 typedef struct ztest_shared_callstate {
@@ -305,9 +301,6 @@ typedef struct ztest_shared_callstate {
 static ztest_shared_callstate_t *ztest_shared_callstate;
 #define        ZTEST_GET_SHARED_CALLSTATE(c) (&ztest_shared_callstate[c])
 
-/*
- * Note: these aren't static because we want dladdr() to work.
- */
 ztest_func_t ztest_dmu_read_write;
 ztest_func_t ztest_dmu_write_parallel;
 ztest_func_t ztest_dmu_object_alloc_free;
@@ -337,6 +330,8 @@ ztest_func_t ztest_vdev_aux_add_remove;
 ztest_func_t ztest_split_pool;
 ztest_func_t ztest_reguid;
 ztest_func_t ztest_spa_upgrade;
+ztest_func_t ztest_fletcher;
+ztest_func_t ztest_verify_dnode_bt;
 
 uint64_t zopt_always = 0ULL * NANOSEC;         /* all the time */
 uint64_t zopt_incessant = 1ULL * NANOSEC / 10; /* every 1/10 second */
@@ -344,40 +339,46 @@ uint64_t zopt_often = 1ULL * NANOSEC;             /* every second */
 uint64_t zopt_sometimes = 10ULL * NANOSEC;     /* every 10 seconds */
 uint64_t zopt_rarely = 60ULL * NANOSEC;                /* every 60 seconds */
 
+#define        ZTI_INIT(func, iters, interval) \
+       {   .zi_func = (func), \
+           .zi_iters = (iters), \
+           .zi_interval = (interval), \
+           .zi_funcname = # func }
+
 ztest_info_t ztest_info[] = {
-       { ztest_dmu_read_write,                 1,      &zopt_always    },
-       { ztest_dmu_write_parallel,             10,     &zopt_always    },
-       { ztest_dmu_object_alloc_free,          1,      &zopt_always    },
-       { ztest_dmu_commit_callbacks,           1,      &zopt_always    },
-       { ztest_zap,                            30,     &zopt_always    },
-       { ztest_zap_parallel,                   100,    &zopt_always    },
-       { ztest_split_pool,                     1,      &zopt_always    },
-       { ztest_zil_commit,                     1,      &zopt_incessant },
-       { ztest_zil_remount,                    1,      &zopt_sometimes },
-       { ztest_dmu_read_write_zcopy,           1,      &zopt_often     },
-       { ztest_dmu_objset_create_destroy,      1,      &zopt_often     },
-       { ztest_dsl_prop_get_set,               1,      &zopt_often     },
-       { ztest_spa_prop_get_set,               1,      &zopt_sometimes },
+       ZTI_INIT(ztest_dmu_read_write, 1, &zopt_always),
+       ZTI_INIT(ztest_dmu_write_parallel, 10, &zopt_always),
+       ZTI_INIT(ztest_dmu_object_alloc_free, 1, &zopt_always),
+       ZTI_INIT(ztest_dmu_commit_callbacks, 1, &zopt_always),
+       ZTI_INIT(ztest_zap, 30, &zopt_always),
+       ZTI_INIT(ztest_zap_parallel, 100, &zopt_always),
+       ZTI_INIT(ztest_split_pool, 1, &zopt_always),
+       ZTI_INIT(ztest_zil_commit, 1, &zopt_incessant),
+       ZTI_INIT(ztest_zil_remount, 1, &zopt_sometimes),
+       ZTI_INIT(ztest_dmu_read_write_zcopy, 1, &zopt_often),
+       ZTI_INIT(ztest_dmu_objset_create_destroy, 1, &zopt_often),
+       ZTI_INIT(ztest_dsl_prop_get_set, 1, &zopt_often),
+       ZTI_INIT(ztest_spa_prop_get_set, 1, &zopt_sometimes),
 #if 0
-       { ztest_dmu_prealloc,                   1,      &zopt_sometimes },
+       ZTI_INIT(ztest_dmu_prealloc, 1, &zopt_sometimes),
 #endif
-       { ztest_fzap,                           1,      &zopt_sometimes },
-       { ztest_dmu_snapshot_create_destroy,    1,      &zopt_sometimes },
-       { ztest_spa_create_destroy,             1,      &zopt_sometimes },
-       { ztest_fault_inject,                   1,      &zopt_sometimes },
-       { ztest_ddt_repair,                     1,      &zopt_sometimes },
-       { ztest_dmu_snapshot_hold,              1,      &zopt_sometimes },
-       { ztest_reguid,                         1,      &zopt_rarely    },
-       { ztest_spa_rename,                     1,      &zopt_rarely    },
-       { ztest_scrub,                          1,      &zopt_rarely    },
-       { ztest_spa_upgrade,                    1,      &zopt_rarely    },
-       { ztest_dsl_dataset_promote_busy,       1,      &zopt_rarely    },
-       { ztest_vdev_attach_detach,             1,      &zopt_sometimes },
-       { ztest_vdev_LUN_growth,                1,      &zopt_rarely    },
-       { ztest_vdev_add_remove,                1,
-           &ztest_opts.zo_vdevtime                             },
-       { ztest_vdev_aux_add_remove,            1,
-           &ztest_opts.zo_vdevtime                             },
+       ZTI_INIT(ztest_fzap, 1, &zopt_sometimes),
+       ZTI_INIT(ztest_dmu_snapshot_create_destroy, 1, &zopt_sometimes),
+       ZTI_INIT(ztest_spa_create_destroy, 1, &zopt_sometimes),
+       ZTI_INIT(ztest_fault_inject, 1, &zopt_sometimes),
+       ZTI_INIT(ztest_ddt_repair, 1, &zopt_sometimes),
+       ZTI_INIT(ztest_dmu_snapshot_hold, 1, &zopt_sometimes),
+       ZTI_INIT(ztest_reguid, 1, &zopt_rarely),
+       ZTI_INIT(ztest_spa_rename, 1, &zopt_rarely),
+       ZTI_INIT(ztest_scrub, 1, &zopt_rarely),
+       ZTI_INIT(ztest_spa_upgrade, 1, &zopt_rarely),
+       ZTI_INIT(ztest_dsl_dataset_promote_busy, 1, &zopt_rarely),
+       ZTI_INIT(ztest_vdev_attach_detach, 1, &zopt_sometimes),
+       ZTI_INIT(ztest_vdev_LUN_growth, 1, &zopt_rarely),
+       ZTI_INIT(ztest_vdev_add_remove, 1, &ztest_opts.zo_vdevtime),
+       ZTI_INIT(ztest_vdev_aux_add_remove, 1, &ztest_opts.zo_vdevtime),
+       ZTI_INIT(ztest_fletcher, 1, &zopt_rarely),
+       ZTI_INIT(ztest_verify_dnode_bt, 1, &zopt_sometimes),
 };
 
 #define        ZTEST_FUNCS     (sizeof (ztest_info) / sizeof (ztest_info_t))
@@ -481,6 +482,30 @@ _umem_logging_init(void)
        return ("fail,contents"); /* $UMEM_LOGGING setting */
 }
 
+#define        BACKTRACE_SZ    100
+
+static void sig_handler(int signo)
+{
+       struct sigaction action;
+#ifdef __GLIBC__ /* backtrace() is a GNU extension */
+       int nptrs;
+       void *buffer[BACKTRACE_SZ];
+
+       nptrs = backtrace(buffer, BACKTRACE_SZ);
+       backtrace_symbols_fd(buffer, nptrs, STDERR_FILENO);
+#endif
+
+       /*
+        * Restore default action and re-raise signal so SIGSEGV and
+        * SIGABRT can trigger a core dump.
+        */
+       action.sa_handler = SIG_DFL;
+       sigemptyset(&action.sa_mask);
+       action.sa_flags = 0;
+       (void) sigaction(signo, &action, NULL);
+       raise(signo);
+}
+
 #define        FATAL_MSG_SZ    1024
 
 char *fatal_msg;
@@ -799,9 +824,6 @@ ztest_kill(ztest_shared_t *zs)
        spa_config_sync(ztest_spa, B_FALSE, B_FALSE);
        mutex_exit(&spa_namespace_lock);
 
-       if (ztest_opts.zo_verbose >= 3)
-               zfs_dbgmsg_print(FTAG);
-
        (void) kill(getpid(), SIGKILL);
 }
 
@@ -832,7 +854,7 @@ static uint64_t
 ztest_get_ashift(void)
 {
        if (ztest_opts.zo_ashift == 0)
-               return (SPA_MINBLOCKSHIFT + ztest_random(3));
+               return (SPA_MINBLOCKSHIFT + ztest_random(5));
        return (ztest_opts.zo_ashift);
 }
 
@@ -997,8 +1019,46 @@ ztest_random_spa_version(uint64_t initial_version)
 static int
 ztest_random_blocksize(void)
 {
-       return (1 << (SPA_MINBLOCKSHIFT +
-           ztest_random(SPA_MAXBLOCKSHIFT - SPA_MINBLOCKSHIFT + 1)));
+       /*
+        * Choose a block size >= the ashift.
+        * If the SPA supports new MAXBLOCKSIZE, test up to 1MB blocks.
+        */
+       int maxbs = SPA_OLD_MAXBLOCKSHIFT;
+       if (spa_maxblocksize(ztest_spa) == SPA_MAXBLOCKSIZE)
+               maxbs = 20;
+       uint64_t block_shift =
+           ztest_random(maxbs - ztest_spa->spa_max_ashift + 1);
+       return (1 << (SPA_MINBLOCKSHIFT + block_shift));
+}
+
+static int
+ztest_random_dnodesize(void)
+{
+       int slots;
+       int max_slots = spa_maxdnodesize(ztest_spa) >> DNODE_SHIFT;
+
+       if (max_slots == DNODE_MIN_SLOTS)
+               return (DNODE_MIN_SIZE);
+
+       /*
+        * Weight the random distribution more heavily toward smaller
+        * dnode sizes since that is more likely to reflect real-world
+        * usage.
+        */
+       ASSERT3U(max_slots, >, 4);
+       switch (ztest_random(10)) {
+       case 0:
+               slots = 5 + ztest_random(max_slots - 4);
+               break;
+       case 1 ... 4:
+               slots = 2 + ztest_random(3);
+               break;
+       default:
+               slots = 1;
+               break;
+       }
+
+       return (slots << DNODE_SHIFT);
 }
 
 static int
@@ -1061,9 +1121,16 @@ ztest_dsl_prop_set_uint64(char *osname, zfs_prop_t prop, uint64_t value,
        VERIFY0(dsl_prop_get_integer(osname, propname, &curval, setpoint));
 
        if (ztest_opts.zo_verbose >= 6) {
-               VERIFY(zfs_prop_index_to_string(prop, curval, &valname) == 0);
-               (void) printf("%s %s = %s at '%s'\n",
-                   osname, propname, valname, setpoint);
+               int err;
+
+               err = zfs_prop_index_to_string(prop, curval, &valname);
+               if (err)
+                       (void) printf("%s %s = %llu at '%s'\n",
+                           osname, propname, (unsigned long long)curval,
+                               setpoint);
+               else
+                       (void) printf("%s %s = %s at '%s'\n",
+                           osname, propname, valname, setpoint);
        }
        umem_free(setpoint, MAXPATHLEN);
 
@@ -1093,6 +1160,100 @@ ztest_spa_prop_set_uint64(zpool_prop_t prop, uint64_t value)
        return (error);
 }
 
+
+/*
+ * Object and range lock mechanics
+ */
+typedef struct {
+       list_node_t z_lnode;
+       refcount_t z_refcnt;
+       uint64_t z_object;
+       zfs_rlock_t z_range_lock;
+} ztest_znode_t;
+
+typedef struct {
+       rl_t *z_rl;
+       ztest_znode_t *z_ztznode;
+} ztest_zrl_t;
+
+static ztest_znode_t *
+ztest_znode_init(uint64_t object)
+{
+       ztest_znode_t *zp = umem_alloc(sizeof (*zp), UMEM_NOFAIL);
+
+       list_link_init(&zp->z_lnode);
+       refcount_create(&zp->z_refcnt);
+       zp->z_object = object;
+       zfs_rlock_init(&zp->z_range_lock);
+
+       return (zp);
+}
+
+static void
+ztest_znode_fini(ztest_znode_t *zp)
+{
+       ASSERT(refcount_is_zero(&zp->z_refcnt));
+       zfs_rlock_destroy(&zp->z_range_lock);
+       zp->z_object = 0;
+       refcount_destroy(&zp->z_refcnt);
+       list_link_init(&zp->z_lnode);
+       umem_free(zp, sizeof (*zp));
+}
+
+static void
+ztest_zll_init(zll_t *zll)
+{
+       mutex_init(&zll->z_lock, NULL, MUTEX_DEFAULT, NULL);
+       list_create(&zll->z_list, sizeof (ztest_znode_t),
+           offsetof(ztest_znode_t, z_lnode));
+}
+
+static void
+ztest_zll_destroy(zll_t *zll)
+{
+       list_destroy(&zll->z_list);
+       mutex_destroy(&zll->z_lock);
+}
+
+#define        RL_TAG "range_lock"
+static ztest_znode_t *
+ztest_znode_get(ztest_ds_t *zd, uint64_t object)
+{
+       zll_t *zll = &zd->zd_range_lock[object & (ZTEST_OBJECT_LOCKS - 1)];
+       ztest_znode_t *zp = NULL;
+       mutex_enter(&zll->z_lock);
+       for (zp = list_head(&zll->z_list); (zp);
+           zp = list_next(&zll->z_list, zp)) {
+               if (zp->z_object == object) {
+                       refcount_add(&zp->z_refcnt, RL_TAG);
+                       break;
+               }
+       }
+       if (zp == NULL) {
+               zp = ztest_znode_init(object);
+               refcount_add(&zp->z_refcnt, RL_TAG);
+               list_insert_head(&zll->z_list, zp);
+       }
+       mutex_exit(&zll->z_lock);
+       return (zp);
+}
+
+static void
+ztest_znode_put(ztest_ds_t *zd, ztest_znode_t *zp)
+{
+       zll_t *zll = NULL;
+       ASSERT3U(zp->z_object, !=, 0);
+       zll = &zd->zd_range_lock[zp->z_object & (ZTEST_OBJECT_LOCKS - 1)];
+       mutex_enter(&zll->z_lock);
+       refcount_remove(&zp->z_refcnt, RL_TAG);
+       if (refcount_is_zero(&zp->z_refcnt)) {
+               list_remove(&zll->z_list, zp);
+               ztest_znode_fini(zp);
+       }
+       mutex_exit(&zll->z_lock);
+}
+
+
 static void
 ztest_rll_init(rll_t *rll)
 {
@@ -1165,33 +1326,37 @@ ztest_object_unlock(ztest_ds_t *zd, uint64_t object)
        ztest_rll_unlock(rll);
 }
 
-static rl_t *
-ztest_range_lock(ztest_ds_t *zd, uint64_t object, uint64_t offset,
-    uint64_t size, rl_type_t type)
+static ztest_zrl_t *
+ztest_zrl_init(rl_t *rl, ztest_znode_t *zp)
 {
-       uint64_t hash = object ^ (offset % (ZTEST_RANGE_LOCKS + 1));
-       rll_t *rll = &zd->zd_range_lock[hash & (ZTEST_RANGE_LOCKS - 1)];
-       rl_t *rl;
-
-       rl = umem_alloc(sizeof (*rl), UMEM_NOFAIL);
-       rl->rl_object = object;
-       rl->rl_offset = offset;
-       rl->rl_size = size;
-       rl->rl_lock = rll;
-
-       ztest_rll_lock(rll, type);
-
-       return (rl);
+       ztest_zrl_t *zrl = umem_alloc(sizeof (*zrl), UMEM_NOFAIL);
+       zrl->z_rl = rl;
+       zrl->z_ztznode = zp;
+       return (zrl);
 }
 
 static void
-ztest_range_unlock(rl_t *rl)
+ztest_zrl_fini(ztest_zrl_t *zrl)
 {
-       rll_t *rll = rl->rl_lock;
+       umem_free(zrl, sizeof (*zrl));
+}
 
-       ztest_rll_unlock(rll);
+static ztest_zrl_t *
+ztest_range_lock(ztest_ds_t *zd, uint64_t object, uint64_t offset,
+    uint64_t size, rl_type_t type)
+{
+       ztest_znode_t *zp = ztest_znode_get(zd, object);
+       rl_t *rl = zfs_range_lock(&zp->z_range_lock, offset,
+           size, type);
+       return (ztest_zrl_init(rl, zp));
+}
 
-       umem_free(rl, sizeof (*rl));
+static void
+ztest_range_unlock(ztest_ds_t *zd, ztest_zrl_t *zrl)
+{
+       zfs_range_unlock(zrl->z_rl);
+       ztest_znode_put(zd, zrl->z_ztznode);
+       ztest_zrl_fini(zrl);
 }
 
 static void
@@ -1213,7 +1378,7 @@ ztest_zd_init(ztest_ds_t *zd, ztest_shared_ds_t *szd, objset_t *os)
                ztest_rll_init(&zd->zd_object_lock[l]);
 
        for (l = 0; l < ZTEST_RANGE_LOCKS; l++)
-               ztest_rll_init(&zd->zd_range_lock[l]);
+               ztest_zll_init(&zd->zd_range_lock[l]);
 }
 
 static void
@@ -1228,7 +1393,7 @@ ztest_zd_fini(ztest_ds_t *zd)
                ztest_rll_destroy(&zd->zd_object_lock[l]);
 
        for (l = 0; l < ZTEST_RANGE_LOCKS; l++)
-               ztest_rll_destroy(&zd->zd_range_lock[l]);
+               ztest_zll_destroy(&zd->zd_range_lock[l]);
 }
 
 #define        TXG_MIGHTWAIT   (ztest_random(10) == 0 ? TXG_NOWAIT : TXG_WAIT)
@@ -1286,11 +1451,13 @@ ztest_pattern_match(void *buf, uint64_t size, uint64_t value)
 
 static void
 ztest_bt_generate(ztest_block_tag_t *bt, objset_t *os, uint64_t object,
-    uint64_t offset, uint64_t gen, uint64_t txg, uint64_t crtxg)
+    uint64_t dnodesize, uint64_t offset, uint64_t gen, uint64_t txg,
+    uint64_t crtxg)
 {
        bt->bt_magic = BT_MAGIC;
        bt->bt_objset = dmu_objset_id(os);
        bt->bt_object = object;
+       bt->bt_dnodesize = dnodesize;
        bt->bt_offset = offset;
        bt->bt_gen = gen;
        bt->bt_txg = txg;
@@ -1299,15 +1466,17 @@ ztest_bt_generate(ztest_block_tag_t *bt, objset_t *os, uint64_t object,
 
 static void
 ztest_bt_verify(ztest_block_tag_t *bt, objset_t *os, uint64_t object,
-    uint64_t offset, uint64_t gen, uint64_t txg, uint64_t crtxg)
+    uint64_t dnodesize, uint64_t offset, uint64_t gen, uint64_t txg,
+    uint64_t crtxg)
 {
-       ASSERT(bt->bt_magic == BT_MAGIC);
-       ASSERT(bt->bt_objset == dmu_objset_id(os));
-       ASSERT(bt->bt_object == object);
-       ASSERT(bt->bt_offset == offset);
-       ASSERT(bt->bt_gen <= gen);
-       ASSERT(bt->bt_txg <= txg);
-       ASSERT(bt->bt_crtxg == crtxg);
+       ASSERT3U(bt->bt_magic, ==, BT_MAGIC);
+       ASSERT3U(bt->bt_objset, ==, dmu_objset_id(os));
+       ASSERT3U(bt->bt_object, ==, object);
+       ASSERT3U(bt->bt_dnodesize, ==, dnodesize);
+       ASSERT3U(bt->bt_offset, ==, offset);
+       ASSERT3U(bt->bt_gen, <=, gen);
+       ASSERT3U(bt->bt_txg, <=, txg);
+       ASSERT3U(bt->bt_crtxg, ==, crtxg);
 }
 
 static ztest_block_tag_t *
@@ -1324,6 +1493,52 @@ ztest_bt_bonus(dmu_buf_t *db)
        return (bt);
 }
 
+/*
+ * Generate a token to fill up unused bonus buffer space.  Try to make
+ * it unique to the object, generation, and offset to verify that data
+ * is not getting overwritten by data from other dnodes.
+ */
+#define        ZTEST_BONUS_FILL_TOKEN(obj, ds, gen, offset) \
+       (((ds) << 48) | ((gen) << 32) | ((obj) << 8) | (offset))
+
+/*
+ * Fill up the unused bonus buffer region before the block tag with a
+ * verifiable pattern. Filling the whole bonus area with non-zero data
+ * helps ensure that all dnode traversal code properly skips the
+ * interior regions of large dnodes.
+ */
+void
+ztest_fill_unused_bonus(dmu_buf_t *db, void *end, uint64_t obj,
+    objset_t *os, uint64_t gen)
+{
+       uint64_t *bonusp;
+
+       ASSERT(IS_P2ALIGNED((char *)end - (char *)db->db_data, 8));
+
+       for (bonusp = db->db_data; bonusp < (uint64_t *)end; bonusp++) {
+               uint64_t token = ZTEST_BONUS_FILL_TOKEN(obj, dmu_objset_id(os),
+                   gen, bonusp - (uint64_t *)db->db_data);
+               *bonusp = token;
+       }
+}
+
+/*
+ * Verify that the unused area of a bonus buffer is filled with the
+ * expected tokens.
+ */
+void
+ztest_verify_unused_bonus(dmu_buf_t *db, void *end, uint64_t obj,
+    objset_t *os, uint64_t gen)
+{
+       uint64_t *bonusp;
+
+       for (bonusp = db->db_data; bonusp < (uint64_t *)end; bonusp++) {
+               uint64_t token = ZTEST_BONUS_FILL_TOKEN(obj, dmu_objset_id(os),
+                   gen, bonusp - (uint64_t *)db->db_data);
+               VERIFY3U(*bonusp, ==, token);
+       }
+}
+
 /*
  * ZIL logging ops
  */
@@ -1332,7 +1547,7 @@ ztest_bt_bonus(dmu_buf_t *db)
 #define        lrz_blocksize   lr_uid
 #define        lrz_ibshift     lr_gid
 #define        lrz_bonustype   lr_rdev
-#define        lrz_bonuslen    lr_crtime[1]
+#define        lrz_dnodesize   lr_crtime[1]
 
 static void
 ztest_log_create(ztest_ds_t *zd, dmu_tx_t *tx, lr_create_t *lr)
@@ -1447,6 +1662,7 @@ ztest_replay_create(ztest_ds_t *zd, lr_create_t *lr, boolean_t byteswap)
        dmu_tx_t *tx;
        uint64_t txg;
        int error = 0;
+       int bonuslen;
 
        if (byteswap)
                byteswap_uint64_array(lr, sizeof (*lr));
@@ -1469,26 +1685,27 @@ ztest_replay_create(ztest_ds_t *zd, lr_create_t *lr, boolean_t byteswap)
                return (ENOSPC);
 
        ASSERT(dmu_objset_zil(os)->zl_replay == !!lr->lr_foid);
+       bonuslen = DN_BONUS_SIZE(lr->lrz_dnodesize);
 
        if (lr->lrz_type == DMU_OT_ZAP_OTHER) {
                if (lr->lr_foid == 0) {
-                       lr->lr_foid = zap_create(os,
+                       lr->lr_foid = zap_create_dnsize(os,
                            lr->lrz_type, lr->lrz_bonustype,
-                           lr->lrz_bonuslen, tx);
+                           bonuslen, lr->lrz_dnodesize, tx);
                } else {
-                       error = zap_create_claim(os, lr->lr_foid,
+                       error = zap_create_claim_dnsize(os, lr->lr_foid,
                            lr->lrz_type, lr->lrz_bonustype,
-                           lr->lrz_bonuslen, tx);
+                           bonuslen, lr->lrz_dnodesize, tx);
                }
        } else {
                if (lr->lr_foid == 0) {
-                       lr->lr_foid = dmu_object_alloc(os,
+                       lr->lr_foid = dmu_object_alloc_dnsize(os,
                            lr->lrz_type, 0, lr->lrz_bonustype,
-                           lr->lrz_bonuslen, tx);
+                           bonuslen, lr->lrz_dnodesize, tx);
                } else {
-                       error = dmu_object_claim(os, lr->lr_foid,
+                       error = dmu_object_claim_dnsize(os, lr->lr_foid,
                            lr->lrz_type, 0, lr->lrz_bonustype,
-                           lr->lrz_bonuslen, tx);
+                           bonuslen, lr->lrz_dnodesize, tx);
                }
        }
 
@@ -1508,7 +1725,9 @@ ztest_replay_create(ztest_ds_t *zd, lr_create_t *lr, boolean_t byteswap)
        VERIFY3U(0, ==, dmu_bonus_hold(os, lr->lr_foid, FTAG, &db));
        bbt = ztest_bt_bonus(db);
        dmu_buf_will_dirty(db, tx);
-       ztest_bt_generate(bbt, os, lr->lr_foid, -1ULL, lr->lr_gen, txg, txg);
+       ztest_bt_generate(bbt, os, lr->lr_foid, lr->lrz_dnodesize, -1ULL,
+           lr->lr_gen, txg, txg);
+       ztest_fill_unused_bonus(db, bbt, lr->lr_foid, os, lr->lr_gen);
        dmu_buf_rele(db, FTAG);
 
        VERIFY3U(0, ==, zap_add(os, lr->lr_doid, name, sizeof (uint64_t), 1,
@@ -1585,7 +1804,7 @@ ztest_replay_write(ztest_ds_t *zd, lr_write_t *lr, boolean_t byteswap)
        dmu_tx_t *tx;
        dmu_buf_t *db;
        arc_buf_t *abuf = NULL;
-       rl_t *rl;
+       ztest_zrl_t *rl;
 
        if (byteswap)
                byteswap_uint64_array(lr, sizeof (*lr));
@@ -1634,7 +1853,7 @@ ztest_replay_write(ztest_ds_t *zd, lr_write_t *lr, boolean_t byteswap)
                if (abuf != NULL)
                        dmu_return_arcbuf(abuf);
                dmu_buf_rele(db, FTAG);
-               ztest_range_unlock(rl);
+               ztest_range_unlock(zd, rl);
                ztest_object_unlock(zd, lr->lr_foid);
                return (ENOSPC);
        }
@@ -1654,7 +1873,7 @@ ztest_replay_write(ztest_ds_t *zd, lr_write_t *lr, boolean_t byteswap)
                        VERIFY(dmu_read(os, lr->lr_foid, offset,
                            sizeof (rbt), &rbt, prefetch) == 0);
                        if (rbt.bt_magic == BT_MAGIC) {
-                               ztest_bt_verify(&rbt, os, lr->lr_foid,
+                               ztest_bt_verify(&rbt, os, lr->lr_foid, 0,
                                    offset, gen, txg, crtxg);
                        }
                }
@@ -1666,7 +1885,7 @@ ztest_replay_write(ztest_ds_t *zd, lr_write_t *lr, boolean_t byteswap)
                 * as it was when the write was generated.
                 */
                if (zd->zd_zilog->zl_replay) {
-                       ztest_bt_verify(bt, os, lr->lr_foid, offset,
+                       ztest_bt_verify(bt, os, lr->lr_foid, 0, offset,
                            MAX(gen, bt->bt_gen), MAX(txg, lrtxg),
                            bt->bt_crtxg);
                }
@@ -1675,7 +1894,8 @@ ztest_replay_write(ztest_ds_t *zd, lr_write_t *lr, boolean_t byteswap)
                 * Set the bt's gen/txg to the bonus buffer's gen/txg
                 * so that all of the usual ASSERTs will work.
                 */
-               ztest_bt_generate(bt, os, lr->lr_foid, offset, gen, txg, crtxg);
+               ztest_bt_generate(bt, os, lr->lr_foid, 0, offset, gen, txg,
+                   crtxg);
        }
 
        if (abuf == NULL) {
@@ -1691,7 +1911,7 @@ ztest_replay_write(ztest_ds_t *zd, lr_write_t *lr, boolean_t byteswap)
 
        dmu_tx_commit(tx);
 
-       ztest_range_unlock(rl);
+       ztest_range_unlock(zd, rl);
        ztest_object_unlock(zd, lr->lr_foid);
 
        return (0);
@@ -1703,7 +1923,7 @@ ztest_replay_truncate(ztest_ds_t *zd, lr_truncate_t *lr, boolean_t byteswap)
        objset_t *os = zd->zd_os;
        dmu_tx_t *tx;
        uint64_t txg;
-       rl_t *rl;
+       ztest_zrl_t *rl;
 
        if (byteswap)
                byteswap_uint64_array(lr, sizeof (*lr));
@@ -1718,7 +1938,7 @@ ztest_replay_truncate(ztest_ds_t *zd, lr_truncate_t *lr, boolean_t byteswap)
 
        txg = ztest_tx_assign(tx, TXG_WAIT, FTAG);
        if (txg == 0) {
-               ztest_range_unlock(rl);
+               ztest_range_unlock(zd, rl);
                ztest_object_unlock(zd, lr->lr_foid);
                return (ENOSPC);
        }
@@ -1730,7 +1950,7 @@ ztest_replay_truncate(ztest_ds_t *zd, lr_truncate_t *lr, boolean_t byteswap)
 
        dmu_tx_commit(tx);
 
-       ztest_range_unlock(rl);
+       ztest_range_unlock(zd, rl);
        ztest_object_unlock(zd, lr->lr_foid);
 
        return (0);
@@ -1743,7 +1963,7 @@ ztest_replay_setattr(ztest_ds_t *zd, lr_setattr_t *lr, boolean_t byteswap)
        dmu_tx_t *tx;
        dmu_buf_t *db;
        ztest_block_tag_t *bbt;
-       uint64_t txg, lrtxg, crtxg;
+       uint64_t txg, lrtxg, crtxg, dnodesize;
 
        if (byteswap)
                byteswap_uint64_array(lr, sizeof (*lr));
@@ -1766,6 +1986,7 @@ ztest_replay_setattr(ztest_ds_t *zd, lr_setattr_t *lr, boolean_t byteswap)
        ASSERT3U(bbt->bt_magic, ==, BT_MAGIC);
        crtxg = bbt->bt_crtxg;
        lrtxg = lr->lr_common.lrc_txg;
+       dnodesize = bbt->bt_dnodesize;
 
        if (zd->zd_zilog->zl_replay) {
                ASSERT(lr->lr_size != 0);
@@ -1784,7 +2005,7 @@ ztest_replay_setattr(ztest_ds_t *zd, lr_setattr_t *lr, boolean_t byteswap)
        /*
         * Verify that the current bonus buffer is not newer than our txg.
         */
-       ztest_bt_verify(bbt, os, lr->lr_foid, -1ULL, lr->lr_mode,
+       ztest_bt_verify(bbt, os, lr->lr_foid, dnodesize, -1ULL, lr->lr_mode,
            MAX(txg, lrtxg), crtxg);
 
        dmu_buf_will_dirty(db, tx);
@@ -1794,8 +2015,9 @@ ztest_replay_setattr(ztest_ds_t *zd, lr_setattr_t *lr, boolean_t byteswap)
        VERIFY0(dmu_set_bonus(db, lr->lr_size, tx));
        bbt = ztest_bt_bonus(db);
 
-       ztest_bt_generate(bbt, os, lr->lr_foid, -1ULL, lr->lr_mode, txg, crtxg);
-
+       ztest_bt_generate(bbt, os, lr->lr_foid, dnodesize, -1ULL, lr->lr_mode,
+           txg, crtxg);
+       ztest_fill_unused_bonus(db, bbt, lr->lr_foid, os, bbt->bt_gen);
        dmu_buf_rele(db, FTAG);
 
        (void) ztest_log_setattr(zd, tx, lr);
@@ -1833,23 +2055,30 @@ zil_replay_func_t ztest_replay_vector[TX_MAX_TYPE] = {
 /*
  * ZIL get_data callbacks
  */
+typedef struct ztest_zgd_private {
+       ztest_ds_t *z_zd;
+       ztest_zrl_t *z_rl;
+       uint64_t z_object;
+} ztest_zgd_private_t;
 
 static void
 ztest_get_done(zgd_t *zgd, int error)
 {
-       ztest_ds_t *zd = zgd->zgd_private;
-       uint64_t object = zgd->zgd_rl->rl_object;
+       ztest_zgd_private_t *zzp = zgd->zgd_private;
+       ztest_ds_t *zd = zzp->z_zd;
+       uint64_t object = zzp->z_object;
 
        if (zgd->zgd_db)
                dmu_buf_rele(zgd->zgd_db, zgd);
 
-       ztest_range_unlock(zgd->zgd_rl);
+       ztest_range_unlock(zd, zzp->z_rl);
        ztest_object_unlock(zd, object);
 
        if (error == 0 && zgd->zgd_bp)
                zil_add_block(zgd->zgd_zilog, zgd->zgd_bp);
 
        umem_free(zgd, sizeof (*zgd));
+       umem_free(zzp, sizeof (*zzp));
 }
 
 static int
@@ -1867,6 +2096,7 @@ ztest_get_data(void *arg, lr_write_t *lr, char *buf, zio_t *zio)
        dmu_buf_t *db;
        zgd_t *zgd;
        int error;
+       ztest_zgd_private_t *zgd_private;
 
        ztest_object_lock(zd, object, RL_READER);
        error = dmu_bonus_hold(os, object, FTAG, &db);
@@ -1889,10 +2119,13 @@ ztest_get_data(void *arg, lr_write_t *lr, char *buf, zio_t *zio)
 
        zgd = umem_zalloc(sizeof (*zgd), UMEM_NOFAIL);
        zgd->zgd_zilog = zd->zd_zilog;
-       zgd->zgd_private = zd;
+       zgd_private = umem_zalloc(sizeof (ztest_zgd_private_t), UMEM_NOFAIL);
+       zgd_private->z_zd = zd;
+       zgd_private->z_object = object;
+       zgd->zgd_private = zgd_private;
 
        if (buf != NULL) {      /* immediate write */
-               zgd->zgd_rl = ztest_range_lock(zd, object, offset, size,
+               zgd_private->z_rl = ztest_range_lock(zd, object, offset, size,
                    RL_READER);
 
                error = dmu_read(os, object, offset, size, buf,
@@ -1907,7 +2140,7 @@ ztest_get_data(void *arg, lr_write_t *lr, char *buf, zio_t *zio)
                        offset = 0;
                }
 
-               zgd->zgd_rl = ztest_range_lock(zd, object, offset, size,
+               zgd_private->z_rl = ztest_range_lock(zd, object, offset, size,
                    RL_READER);
 
                error = dmu_buf_hold(os, object, offset, zgd, &db,
@@ -2029,7 +2262,7 @@ ztest_create(ztest_ds_t *zd, ztest_od_t *od, int count)
                lr->lrz_blocksize = od->od_crblocksize;
                lr->lrz_ibshift = ztest_random_ibshift();
                lr->lrz_bonustype = DMU_OT_UINT64_OTHER;
-               lr->lrz_bonuslen = dmu_bonus_max();
+               lr->lrz_dnodesize = od->od_crdnodesize;
                lr->lr_gen = od->od_crgen;
                lr->lr_crtime[0] = time(NULL);
 
@@ -2158,7 +2391,7 @@ ztest_prealloc(ztest_ds_t *zd, uint64_t object, uint64_t offset, uint64_t size)
        objset_t *os = zd->zd_os;
        dmu_tx_t *tx;
        uint64_t txg;
-       rl_t *rl;
+       ztest_zrl_t *rl;
 
        txg_wait_synced(dmu_objset_pool(os), 0);
 
@@ -2179,7 +2412,7 @@ ztest_prealloc(ztest_ds_t *zd, uint64_t object, uint64_t offset, uint64_t size)
                (void) dmu_free_long_range(os, object, offset, size);
        }
 
-       ztest_range_unlock(rl);
+       ztest_range_unlock(zd, rl);
        ztest_object_unlock(zd, object);
 }
 
@@ -2209,7 +2442,8 @@ ztest_io(ztest_ds_t *zd, uint64_t object, uint64_t offset)
        switch (io_type) {
 
        case ZTEST_IO_WRITE_TAG:
-               ztest_bt_generate(&wbt, zd->zd_os, object, offset, 0, 0, 0);
+               ztest_bt_generate(&wbt, zd->zd_os, object, doi.doi_dnodesize,
+                   offset, 0, 0, 0);
                (void) ztest_write(zd, object, offset, sizeof (wbt), &wbt);
                break;
 
@@ -2272,13 +2506,15 @@ ztest_io(ztest_ds_t *zd, uint64_t object, uint64_t offset)
  */
 static void
 ztest_od_init(ztest_od_t *od, uint64_t id, char *tag, uint64_t index,
-    dmu_object_type_t type, uint64_t blocksize, uint64_t gen)
+    dmu_object_type_t type, uint64_t blocksize, uint64_t dnodesize,
+    uint64_t gen)
 {
        od->od_dir = ZTEST_DIROBJ;
        od->od_object = 0;
 
        od->od_crtype = type;
        od->od_crblocksize = blocksize ? blocksize : ztest_random_blocksize();
+       od->od_crdnodesize = dnodesize ? dnodesize : ztest_random_dnodesize();
        od->od_crgen = gen;
 
        od->od_type = DMU_OT_NONE;
@@ -3557,6 +3793,11 @@ ztest_dsl_dataset_promote_busy(ztest_ds_t *zd, uint64_t id)
        if (error)
                fatal(0, "dmu_objset_own(%s) = %d", snap2name, error);
        error = dsl_dataset_promote(clone2name, NULL);
+       if (error == ENOSPC) {
+               dmu_objset_disown(os, FTAG);
+               ztest_record_enospc(FTAG);
+               goto out;
+       }
        if (error != EBUSY)
                fatal(0, "dsl_dataset_promote(%s), %d, not EBUSY", clone2name,
                    error);
@@ -3593,7 +3834,8 @@ ztest_dmu_object_alloc_free(ztest_ds_t *zd, uint64_t id)
        batchsize = OD_ARRAY_SIZE;
 
        for (b = 0; b < batchsize; b++)
-               ztest_od_init(od + b, id, FTAG, b, DMU_OT_UINT64_OTHER, 0, 0);
+               ztest_od_init(od + b, id, FTAG, b, DMU_OT_UINT64_OTHER,
+                   0, 0, 0);
 
        /*
         * Destroy the previous batch of objects, create a new batch,
@@ -3662,8 +3904,9 @@ ztest_dmu_read_write(ztest_ds_t *zd, uint64_t id)
        /*
         * Read the directory info.  If it's the first time, set things up.
         */
-       ztest_od_init(od, id, FTAG, 0, DMU_OT_UINT64_OTHER, 0, chunksize);
-       ztest_od_init(od + 1, id, FTAG, 1, DMU_OT_UINT64_OTHER, 0, chunksize);
+       ztest_od_init(od, id, FTAG, 0, DMU_OT_UINT64_OTHER, 0, 0, chunksize);
+       ztest_od_init(od + 1, id, FTAG, 1, DMU_OT_UINT64_OTHER, 0, 0,
+           chunksize);
 
        if (ztest_object_init(zd, od, size, B_FALSE) != 0) {
                umem_free(od, size);
@@ -3683,7 +3926,8 @@ ztest_dmu_read_write(ztest_ds_t *zd, uint64_t id)
         */
        n = ztest_random(regions) * stride + ztest_random(width);
        s = 1 + ztest_random(2 * width - 1);
-       dmu_prefetch(os, bigobj, n * chunksize, s * chunksize);
+       dmu_prefetch(os, bigobj, 0, n * chunksize, s * chunksize,
+           ZIO_PRIORITY_SYNC_READ);
 
        /*
         * Pick a random index and compute the offsets into packobj and bigobj.
@@ -3739,11 +3983,19 @@ ztest_dmu_read_write(ztest_ds_t *zd, uint64_t id)
                return;
        }
 
-       dmu_object_set_checksum(os, bigobj,
-           (enum zio_checksum)ztest_random_dsl_prop(ZFS_PROP_CHECKSUM), tx);
+       enum zio_checksum cksum;
+       do {
+               cksum = (enum zio_checksum)
+                   ztest_random_dsl_prop(ZFS_PROP_CHECKSUM);
+       } while (cksum >= ZIO_CHECKSUM_LEGACY_FUNCTIONS);
+       dmu_object_set_checksum(os, bigobj, cksum, tx);
 
-       dmu_object_set_compress(os, bigobj,
-           (enum zio_compress)ztest_random_dsl_prop(ZFS_PROP_COMPRESSION), tx);
+       enum zio_compress comp;
+       do {
+               comp = (enum zio_compress)
+                   ztest_random_dsl_prop(ZFS_PROP_COMPRESSION);
+       } while (comp >= ZIO_COMPRESS_LEGACY_FUNCTIONS);
+       dmu_object_set_compress(os, bigobj, comp, tx);
 
        /*
         * For each index from n to n + s, verify that the existing bufwad
@@ -3934,8 +4186,9 @@ ztest_dmu_read_write_zcopy(ztest_ds_t *zd, uint64_t id)
        /*
         * Read the directory info.  If it's the first time, set things up.
         */
-       ztest_od_init(od, id, FTAG, 0, DMU_OT_UINT64_OTHER, blocksize, 0);
-       ztest_od_init(od + 1, id, FTAG, 1, DMU_OT_UINT64_OTHER, 0, chunksize);
+       ztest_od_init(od, id, FTAG, 0, DMU_OT_UINT64_OTHER, blocksize, 0, 0);
+       ztest_od_init(od + 1, id, FTAG, 1, DMU_OT_UINT64_OTHER, 0, 0,
+           chunksize);
 
 
        if (ztest_object_init(zd, od, size, B_FALSE) != 0) {
@@ -3993,7 +4246,7 @@ ztest_dmu_read_write_zcopy(ztest_ds_t *zd, uint64_t id)
                 * assign an arcbuf to a dbuf.
                 */
                for (j = 0; j < s; j++) {
-                       if (i != 5) {
+                       if (i != 5 || chunksize < (SPA_MINBLOCKSIZE * 2)) {
                                bigbuf_arcbufs[j] =
                                    dmu_request_arcbuf(bonus_db, chunksize);
                        } else {
@@ -4017,7 +4270,8 @@ ztest_dmu_read_write_zcopy(ztest_ds_t *zd, uint64_t id)
                        umem_free(packbuf, packsize);
                        umem_free(bigbuf, bigsize);
                        for (j = 0; j < s; j++) {
-                               if (i != 5) {
+                               if (i != 5 ||
+                                   chunksize < (SPA_MINBLOCKSIZE * 2)) {
                                        dmu_return_arcbuf(bigbuf_arcbufs[j]);
                                } else {
                                        dmu_return_arcbuf(
@@ -4062,7 +4316,7 @@ ztest_dmu_read_write_zcopy(ztest_ds_t *zd, uint64_t id)
                }
                for (off = bigoff, j = 0; j < s; j++, off += chunksize) {
                        dmu_buf_t *dbt;
-                       if (i != 5) {
+                       if (i != 5 || chunksize < (SPA_MINBLOCKSIZE * 2)) {
                                bcopy((caddr_t)bigbuf + (off - bigoff),
                                    bigbuf_arcbufs[j]->b_data, chunksize);
                        } else {
@@ -4079,7 +4333,7 @@ ztest_dmu_read_write_zcopy(ztest_ds_t *zd, uint64_t id)
                                VERIFY(dmu_buf_hold(os, bigobj, off,
                                    FTAG, &dbt, DMU_READ_NO_PREFETCH) == 0);
                        }
-                       if (i != 5) {
+                       if (i != 5 || chunksize < (SPA_MINBLOCKSIZE * 2)) {
                                dmu_assign_arcbuf(bonus_db, off,
                                    bigbuf_arcbufs[j], tx);
                        } else {
@@ -4142,7 +4396,7 @@ ztest_dmu_write_parallel(ztest_ds_t *zd, uint64_t id)
         * to verify that parallel writes to an object -- even to the
         * same blocks within the object -- doesn't cause any trouble.
         */
-       ztest_od_init(od, ID_PARALLEL, FTAG, 0, DMU_OT_UINT64_OTHER, 0, 0);
+       ztest_od_init(od, ID_PARALLEL, FTAG, 0, DMU_OT_UINT64_OTHER, 0, 0, 0);
 
        if (ztest_object_init(zd, od, sizeof (ztest_od_t), B_FALSE) != 0)
                return;
@@ -4165,7 +4419,7 @@ ztest_dmu_prealloc(ztest_ds_t *zd, uint64_t id)
 
        od = umem_alloc(sizeof (ztest_od_t), UMEM_NOFAIL);
 
-       ztest_od_init(od, id, FTAG, 0, DMU_OT_UINT64_OTHER, blocksize, 0);
+       ztest_od_init(od, id, FTAG, 0, DMU_OT_UINT64_OTHER, blocksize, 0, 0);
 
        if (ztest_object_init(zd, od, sizeof (ztest_od_t),
            !ztest_random(2)) != 0) {
@@ -4218,7 +4472,7 @@ ztest_zap(ztest_ds_t *zd, uint64_t id)
        char *hc[2] = { "s.acl.h", ".s.open.h.hyLZlg" };
 
        od = umem_alloc(sizeof (ztest_od_t), UMEM_NOFAIL);
-       ztest_od_init(od, id, FTAG, 0, DMU_OT_ZAP_OTHER, 0, 0);
+       ztest_od_init(od, id, FTAG, 0, DMU_OT_ZAP_OTHER, 0, 0, 0);
 
        if (ztest_object_init(zd, od, sizeof (ztest_od_t),
                        !ztest_random(2)) != 0)
@@ -4355,7 +4609,7 @@ ztest_fzap(ztest_ds_t *zd, uint64_t id)
        int i;
 
        od = umem_alloc(sizeof (ztest_od_t), UMEM_NOFAIL);
-       ztest_od_init(od, id, FTAG, 0, DMU_OT_ZAP_OTHER, 0, 0);
+       ztest_od_init(od, id, FTAG, 0, DMU_OT_ZAP_OTHER, 0, 0, 0);
 
        if (ztest_object_init(zd, od, sizeof (ztest_od_t),
                                !ztest_random(2)) != 0)
@@ -4404,7 +4658,7 @@ ztest_zap_parallel(ztest_ds_t *zd, uint64_t id)
        void *data;
 
        od = umem_alloc(sizeof (ztest_od_t), UMEM_NOFAIL);
-       ztest_od_init(od, ID_PARALLEL, FTAG, micro, DMU_OT_ZAP_OTHER, 0, 0);
+       ztest_od_init(od, ID_PARALLEL, FTAG, micro, DMU_OT_ZAP_OTHER, 0, 0, 0);
 
        if (ztest_object_init(zd, od, sizeof (ztest_od_t), B_FALSE) != 0) {
                umem_free(od, sizeof (ztest_od_t));
@@ -4593,7 +4847,7 @@ ztest_dmu_commit_callbacks(ztest_ds_t *zd, uint64_t id)
        int i, error = 0;
 
        od = umem_alloc(sizeof (ztest_od_t), UMEM_NOFAIL);
-       ztest_od_init(od, id, FTAG, 0, DMU_OT_UINT64_OTHER, 0, 0);
+       ztest_od_init(od, id, FTAG, 0, DMU_OT_UINT64_OTHER, 0, 0, 0);
 
        if (ztest_object_init(zd, od, sizeof (ztest_od_t), B_FALSE) != 0) {
                umem_free(od, sizeof (ztest_od_t));
@@ -4714,6 +4968,41 @@ ztest_dmu_commit_callbacks(ztest_ds_t *zd, uint64_t id)
        umem_free(od, sizeof (ztest_od_t));
 }
 
+/*
+ * Visit each object in the dataset. Verify that its properties
+ * are consistent what was stored in the block tag when it was created,
+ * and that its unused bonus buffer space has not been overwritten.
+ */
+void
+ztest_verify_dnode_bt(ztest_ds_t *zd, uint64_t id)
+{
+       objset_t *os = zd->zd_os;
+       uint64_t obj;
+       int err = 0;
+
+       for (obj = 0; err == 0; err = dmu_object_next(os, &obj, FALSE, 0)) {
+               ztest_block_tag_t *bt = NULL;
+               dmu_object_info_t doi;
+               dmu_buf_t *db;
+
+               if (dmu_bonus_hold(os, obj, FTAG, &db) != 0)
+                       continue;
+
+               dmu_object_info_from_db(db, &doi);
+               if (doi.doi_bonus_size >= sizeof (*bt))
+                       bt = ztest_bt_bonus(db);
+
+               if (bt && bt->bt_magic == BT_MAGIC) {
+                       ztest_bt_verify(bt, os, obj, doi.doi_dnodesize,
+                           bt->bt_offset, bt->bt_gen, bt->bt_txg,
+                           bt->bt_crtxg);
+                       ztest_verify_unused_bonus(db, bt, obj, os, bt->bt_gen);
+               }
+
+               dmu_buf_rele(db, FTAG);
+       }
+}
+
 /* ARGSUSED */
 void
 ztest_dsl_prop_get_set(ztest_ds_t *zd, uint64_t id)
@@ -4732,6 +5021,9 @@ ztest_dsl_prop_get_set(ztest_ds_t *zd, uint64_t id)
                (void) ztest_dsl_prop_set_uint64(zd->zd_name, proplist[p],
                    ztest_random_dsl_prop(proplist[p]), (int)ztest_random(2));
 
+       VERIFY0(ztest_dsl_prop_set_uint64(zd->zd_name, ZFS_PROP_RECORDSIZE,
+           ztest_random_blocksize(), (int)ztest_random(2)));
+
        (void) rw_unlock(&ztest_name_lock);
 }
 
@@ -4867,8 +5159,13 @@ ztest_dmu_snapshot_hold(ztest_ds_t *zd, uint64_t id)
        error = dsl_dataset_user_hold(holds, 0, NULL);
        fnvlist_free(holds);
 
-       if (error)
-               fatal(0, "dsl_dataset_user_hold(%s)", fullname, tag);
+       if (error == ENOSPC) {
+               ztest_record_enospc("dsl_dataset_user_hold");
+               goto out;
+       } else if (error) {
+               fatal(0, "dsl_dataset_user_hold(%s, %s) = %u",
+                   fullname, tag, error);
+       }
 
        error = dsl_destroy_snapshot(fullname, B_FALSE);
        if (error != EBUSY) {
@@ -5073,6 +5370,31 @@ ztest_fault_inject(ztest_ds_t *zd, uint64_t id)
        fsize = lseek(fd, 0, SEEK_END);
 
        while (--iters != 0) {
+               /*
+                * The offset must be chosen carefully to ensure that
+                * we do not inject a given logical block with errors
+                * on two different leaf devices, because ZFS can not
+                * tolerate that (if maxfaults==1).
+                *
+                * We divide each leaf into chunks of size
+                * (# leaves * SPA_MAXBLOCKSIZE * 4).  Within each chunk
+                * there is a series of ranges to which we can inject errors.
+                * Each range can accept errors on only a single leaf vdev.
+                * The error injection ranges are separated by ranges
+                * which we will not inject errors on any device (DMZs).
+                * Each DMZ must be large enough such that a single block
+                * can not straddle it, so that a single block can not be
+                * a target in two different injection ranges (on different
+                * leaf vdevs).
+                *
+                * For example, with 3 leaves, each chunk looks like:
+                *    0 to  32M: injection range for leaf 0
+                *  32M to  64M: DMZ - no injection allowed
+                *  64M to  96M: injection range for leaf 1
+                *  96M to 128M: DMZ - no injection allowed
+                * 128M to 160M: injection range for leaf 2
+                * 160M to 192M: DMZ - no injection allowed
+                */
                offset = ztest_random(fsize / (leaves << bshift)) *
                    (leaves << bshift) + (leaf << bshift) +
                    (ztest_random(1ULL << (bshift - 1)) & -8ULL);
@@ -5127,7 +5449,7 @@ ztest_ddt_repair(ztest_ds_t *zd, uint64_t id)
        blocksize = MIN(blocksize, 2048);       /* because we write so many */
 
        od = umem_alloc(sizeof (ztest_od_t), UMEM_NOFAIL);
-       ztest_od_init(od, id, FTAG, 0, DMU_OT_UINT64_OTHER, blocksize, 0);
+       ztest_od_init(od, id, FTAG, 0, DMU_OT_UINT64_OTHER, blocksize, 0, 0);
 
        if (ztest_object_init(zd, od, sizeof (ztest_od_t), B_FALSE) != 0) {
                umem_free(od, sizeof (ztest_od_t));
@@ -5309,6 +5631,82 @@ ztest_spa_rename(ztest_ds_t *zd, uint64_t id)
        (void) rw_unlock(&ztest_name_lock);
 }
 
+void
+ztest_fletcher(ztest_ds_t *zd, uint64_t id)
+{
+       hrtime_t end = gethrtime() + NANOSEC;
+
+       while (gethrtime() <= end) {
+               int run_count = 100;
+               void *buf;
+               uint32_t size;
+               int *ptr;
+               int i;
+               zio_cksum_t zc_ref;
+               zio_cksum_t zc_ref_byteswap;
+
+               size = ztest_random_blocksize();
+               buf = umem_alloc(size, UMEM_NOFAIL);
+
+               for (i = 0, ptr = buf; i < size / sizeof (*ptr); i++, ptr++)
+                       *ptr = ztest_random(UINT_MAX);
+
+               VERIFY0(fletcher_4_impl_set("scalar"));
+               fletcher_4_native(buf, size, &zc_ref);
+               fletcher_4_byteswap(buf, size, &zc_ref_byteswap);
+
+               VERIFY0(fletcher_4_impl_set("cycle"));
+               while (run_count-- > 0) {
+                       zio_cksum_t zc;
+                       zio_cksum_t zc_byteswap;
+
+                       fletcher_4_byteswap(buf, size, &zc_byteswap);
+                       fletcher_4_native(buf, size, &zc);
+
+                       VERIFY0(bcmp(&zc, &zc_ref, sizeof (zc)));
+                       VERIFY0(bcmp(&zc_byteswap, &zc_ref_byteswap,
+                           sizeof (zc_byteswap)));
+               }
+
+               umem_free(buf, size);
+       }
+}
+
+static int
+ztest_check_path(char *path)
+{
+       struct stat s;
+       /* return true on success */
+       return (!stat(path, &s));
+}
+
+static void
+ztest_get_zdb_bin(char *bin, int len)
+{
+       char *zdb_path;
+       /*
+        * Try to use ZDB_PATH and in-tree zdb path. If not successful, just
+        * let popen to search through PATH.
+        */
+       if ((zdb_path = getenv("ZDB_PATH"))) {
+               strlcpy(bin, zdb_path, len); /* In env */
+               if (!ztest_check_path(bin)) {
+                       ztest_dump_core = 0;
+                       fatal(1, "invalid ZDB_PATH '%s'", bin);
+               }
+               return;
+       }
+
+       VERIFY(realpath(getexecname(), bin) != NULL);
+       if (strstr(bin, "/ztest/")) {
+               strstr(bin, "/ztest/")[0] = '\0'; /* In-tree */
+               strcat(bin, "/zdb/zdb");
+               if (ztest_check_path(bin))
+                       return;
+       }
+       strcpy(bin, "zdb");
+}
+
 /*
  * Verify pool integrity by running zdb.
  */
@@ -5319,24 +5717,17 @@ ztest_run_zdb(char *pool)
        char *bin;
        char *zdb;
        char *zbuf;
+       const int len = MAXPATHLEN + MAXNAMELEN + 20;
        FILE *fp;
 
-       bin = umem_alloc(MAXPATHLEN + MAXNAMELEN + 20, UMEM_NOFAIL);
-       zdb = umem_alloc(MAXPATHLEN + MAXNAMELEN + 20, UMEM_NOFAIL);
+       bin = umem_alloc(len, UMEM_NOFAIL);
+       zdb = umem_alloc(len, UMEM_NOFAIL);
        zbuf = umem_alloc(1024, UMEM_NOFAIL);
 
-       VERIFY(realpath(getexecname(), bin) != NULL);
-       if (strncmp(bin, "/usr/sbin/ztest", 15) == 0) {
-               strcpy(bin, "/usr/sbin/zdb"); /* Installed */
-       } else if (strncmp(bin, "/sbin/ztest", 11) == 0) {
-               strcpy(bin, "/sbin/zdb"); /* Installed */
-       } else {
-               strstr(bin, "/ztest/")[0] = '\0'; /* In-tree */
-               strcat(bin, "/zdb/zdb");
-       }
+       ztest_get_zdb_bin(bin, len);
 
        (void) sprintf(zdb,
-           "%s -bcc%s%s -U %s %s",
+           "%s -bcc%s%s -d -U %s %s",
            bin,
            ztest_opts.zo_verbose >= 3 ? "s" : "",
            ztest_opts.zo_verbose >= 4 ? "v" : "",
@@ -5363,8 +5754,8 @@ ztest_run_zdb(char *pool)
        else
                fatal(0, "'%s' died with signal %d", zdb, WTERMSIG(status));
 out:
-       umem_free(bin, MAXPATHLEN + MAXNAMELEN + 20);
-       umem_free(zdb, MAXPATHLEN + MAXNAMELEN + 20);
+       umem_free(bin, len);
+       umem_free(zdb, len);
        umem_free(zbuf, 1024);
 }
 
@@ -5521,12 +5912,9 @@ ztest_execute(int test, ztest_info_t *zi, uint64_t id)
        atomic_add_64(&zc->zc_count, 1);
        atomic_add_64(&zc->zc_time, functime);
 
-       if (ztest_opts.zo_verbose >= 4) {
-               Dl_info dli;
-               (void) dladdr((void *)zi->zi_func, &dli);
+       if (ztest_opts.zo_verbose >= 4)
                (void) printf("%6.2f sec in %s\n",
-                   (double)functime / NANOSEC, dli.dli_sname);
-       }
+                   (double)functime / NANOSEC, zi->zi_funcname);
 }
 
 static void *
@@ -5832,9 +6220,6 @@ ztest_run(ztest_shared_t *zs)
        zs->zs_alloc = metaslab_class_get_alloc(spa_normal_class(spa));
        zs->zs_space = metaslab_class_get_space(spa_normal_class(spa));
 
-       if (ztest_opts.zo_verbose >= 3)
-               zfs_dbgmsg_print(FTAG);
-
        umem_free(tid, ztest_opts.zo_threads * sizeof (kt_did_t));
 
        /* Kill the resume thread */
@@ -5846,8 +6231,10 @@ ztest_run(ztest_shared_t *zs)
         * Right before closing the pool, kick off a bunch of async I/O;
         * spa_close() should wait for it to complete.
         */
-       for (object = 1; object < 50; object++)
-               dmu_prefetch(spa->spa_meta_objset, object, 0, 1ULL << 20);
+       for (object = 1; object < 50; object++) {
+               dmu_prefetch(spa->spa_meta_objset, object, 0, 0, 1ULL << 20,
+                   ZIO_PRIORITY_SYNC_READ);
+       }
 
        /* Verify that at least one commit cb was called in a timely fashion */
        if (zc_cb_counter >= ZTEST_COMMIT_CB_MIN_REG)
@@ -5918,17 +6305,31 @@ ztest_freeze(void)
         */
        spa_freeze(spa);
 
+       /*
+        * Because it is hard to predict how much space a write will actually
+        * require beforehand, we leave ourselves some fudge space to write over
+        * capacity.
+        */
+       uint64_t capacity = metaslab_class_get_space(spa_normal_class(spa)) / 2;
+
        /*
         * Run tests that generate log records but don't alter the pool config
         * or depend on DSL sync tasks (snapshots, objset create/destroy, etc).
         * We do a txg_wait_synced() after each iteration to force the txg
         * to increase well beyond the last synced value in the uberblock.
         * The ZIL should be OK with that.
+        *
+        * Run a random number of times less than zo_maxloops and ensure we do
+        * not run out of space on the pool.
         */
        while (ztest_random(10) != 0 &&
-           numloops++ < ztest_opts.zo_maxloops) {
-               ztest_dmu_write_parallel(zd, 0);
-               ztest_dmu_object_alloc_free(zd, 0);
+           numloops++ < ztest_opts.zo_maxloops &&
+           metaslab_class_get_alloc(spa_normal_class(spa)) < capacity) {
+               ztest_od_t od;
+               ztest_od_init(&od, 0, FTAG, 0, DMU_OT_UINT64_OTHER, 0, 0, 0);
+               VERIFY0(ztest_object_init(zd, &od, sizeof (od), B_FALSE));
+               ztest_io(zd, od.od_object,
+                   ztest_random(ZTEST_RANGE_LOCKS) << SPA_MAXBLOCKSHIFT);
                txg_wait_synced(spa_get_dsl(spa), 0);
        }
 
@@ -6087,7 +6488,7 @@ setup_hdr(void)
 
        hdr = (void *)mmap(0, P2ROUNDUP(sizeof (*hdr), getpagesize()),
            PROT_READ | PROT_WRITE, MAP_SHARED, ztest_fd_data, 0);
-       VERIFY3P(hdr, !=, MAP_FAILED);
+       ASSERT(hdr != MAP_FAILED);
 
        VERIFY3U(0, ==, ftruncate(ztest_fd_data, sizeof (ztest_shared_hdr_t)));
 
@@ -6114,14 +6515,14 @@ setup_data(void)
 
        hdr = (void *)mmap(0, P2ROUNDUP(sizeof (*hdr), getpagesize()),
            PROT_READ, MAP_SHARED, ztest_fd_data, 0);
-       VERIFY3P(hdr, !=, MAP_FAILED);
+       ASSERT(hdr != MAP_FAILED);
 
        size = shared_data_size(hdr);
 
        (void) munmap((caddr_t)hdr, P2ROUNDUP(sizeof (*hdr), getpagesize()));
        hdr = ztest_shared_hdr = (void *)mmap(0, P2ROUNDUP(size, getpagesize()),
            PROT_READ | PROT_WRITE, MAP_SHARED, ztest_fd_data, 0);
-       VERIFY3P(hdr, !=, MAP_FAILED);
+       ASSERT(hdr != MAP_FAILED);
        buf = (uint8_t *)hdr;
 
        offset = hdr->zh_hdr_size;
@@ -6246,11 +6647,28 @@ main(int argc, char **argv)
        boolean_t hasalt;
        int f;
        char *fd_data_str = getenv("ZTEST_FD_DATA");
+       struct sigaction action;
 
        (void) setvbuf(stdout, NULL, _IOLBF, 0);
 
        dprintf_setup(&argc, argv);
 
+       action.sa_handler = sig_handler;
+       sigemptyset(&action.sa_mask);
+       action.sa_flags = 0;
+
+       if (sigaction(SIGSEGV, &action, NULL) < 0) {
+               (void) fprintf(stderr, "ztest: cannot catch SIGSEGV: %s.\n",
+                   strerror(errno));
+               exit(EXIT_FAILURE);
+       }
+
+       if (sigaction(SIGABRT, &action, NULL) < 0) {
+               (void) fprintf(stderr, "ztest: cannot catch SIGABRT: %s.\n",
+                   strerror(errno));
+               exit(EXIT_FAILURE);
+       }
+
        ztest_fd_rand = open("/dev/urandom", O_RDONLY);
        ASSERT3S(ztest_fd_rand, >=, 0);
 
@@ -6397,15 +6815,12 @@ main(int argc, char **argv)
                        (void) printf("%7s %9s   %s\n",
                            "-----", "----", "--------");
                        for (f = 0; f < ZTEST_FUNCS; f++) {
-                               Dl_info dli;
-
                                zi = &ztest_info[f];
                                zc = ZTEST_GET_SHARED_CALLSTATE(f);
                                print_time(zc->zc_time, timebuf);
-                               (void) dladdr((void *)zi->zi_func, &dli);
                                (void) printf("%7llu %9s   %s\n",
                                    (u_longlong_t)zc->zc_count, timebuf,
-                                   dli.dli_sname);
+                                   zi->zi_funcname);
                        }
                        (void) printf("\n");
                }