]> git.proxmox.com Git - mirror_zfs-debian.git/blobdiff - include/sys/zio.h
New upstream version 0.7.2
[mirror_zfs-debian.git] / include / sys / zio.h
index 4916d87249eaa668fca4024953dc569362dc7314..4eaabc38c86f206b42e021108d44e88389a8f22e 100644 (file)
 /*
  * Copyright (c) 2005, 2010, Oracle and/or its affiliates. All rights reserved.
  * Copyright 2011 Nexenta Systems, Inc. All rights reserved.
- * Copyright (c) 2012, 2014 by Delphix. All rights reserved.
+ * Copyright (c) 2012, 2017 by Delphix. All rights reserved.
  * Copyright (c) 2013 by Saso Kiselkov. All rights reserved.
+ * Copyright (c) 2013, Joyent, Inc. All rights reserved.
+ * Copyright 2016 Toomas Soome <tsoome@me.com>
  */
 
 #ifndef _ZIO_H
 #define        _ZIO_H
 
+#include <sys/zio_priority.h>
 #include <sys/zfs_context.h>
 #include <sys/spa.h>
 #include <sys/txg.h>
@@ -79,6 +82,10 @@ enum zio_checksum {
        ZIO_CHECKSUM_FLETCHER_4,
        ZIO_CHECKSUM_SHA256,
        ZIO_CHECKSUM_ZILOG2,
+       ZIO_CHECKSUM_NOPARITY,
+       ZIO_CHECKSUM_SHA512,
+       ZIO_CHECKSUM_SKEIN,
+       ZIO_CHECKSUM_EDONR,
        ZIO_CHECKSUM_FUNCTIONS
 };
 
@@ -97,26 +104,6 @@ enum zio_checksum {
 #define        ZIO_DEDUPCHECKSUM       ZIO_CHECKSUM_SHA256
 #define        ZIO_DEDUPDITTO_MIN      100
 
-enum zio_compress {
-       ZIO_COMPRESS_INHERIT = 0,
-       ZIO_COMPRESS_ON,
-       ZIO_COMPRESS_OFF,
-       ZIO_COMPRESS_LZJB,
-       ZIO_COMPRESS_EMPTY,
-       ZIO_COMPRESS_GZIP_1,
-       ZIO_COMPRESS_GZIP_2,
-       ZIO_COMPRESS_GZIP_3,
-       ZIO_COMPRESS_GZIP_4,
-       ZIO_COMPRESS_GZIP_5,
-       ZIO_COMPRESS_GZIP_6,
-       ZIO_COMPRESS_GZIP_7,
-       ZIO_COMPRESS_GZIP_8,
-       ZIO_COMPRESS_GZIP_9,
-       ZIO_COMPRESS_ZLE,
-       ZIO_COMPRESS_LZ4,
-       ZIO_COMPRESS_FUNCTIONS
-};
-
 /*
  * The number of "legacy" compression functions which can be set on individual
  * objects.
@@ -135,6 +122,16 @@ enum zio_compress {
 #define        BOOTFS_COMPRESS_VALID(compress)                 \
        ((compress) == ZIO_COMPRESS_LZJB ||             \
        (compress) == ZIO_COMPRESS_LZ4 ||               \
+       (compress) == ZIO_COMPRESS_GZIP_1 ||            \
+       (compress) == ZIO_COMPRESS_GZIP_2 ||            \
+       (compress) == ZIO_COMPRESS_GZIP_3 ||            \
+       (compress) == ZIO_COMPRESS_GZIP_4 ||            \
+       (compress) == ZIO_COMPRESS_GZIP_5 ||            \
+       (compress) == ZIO_COMPRESS_GZIP_6 ||            \
+       (compress) == ZIO_COMPRESS_GZIP_7 ||            \
+       (compress) == ZIO_COMPRESS_GZIP_8 ||            \
+       (compress) == ZIO_COMPRESS_GZIP_9 ||            \
+       (compress) == ZIO_COMPRESS_ZLE ||               \
        (compress) == ZIO_COMPRESS_ON ||                \
        (compress) == ZIO_COMPRESS_OFF)
 
@@ -147,17 +144,6 @@ enum zio_compress {
 #define        ZIO_FAILURE_MODE_CONTINUE       1
 #define        ZIO_FAILURE_MODE_PANIC          2
 
-typedef enum zio_priority {
-       ZIO_PRIORITY_SYNC_READ,
-       ZIO_PRIORITY_SYNC_WRITE,        /* ZIL */
-       ZIO_PRIORITY_ASYNC_READ,        /* prefetch */
-       ZIO_PRIORITY_ASYNC_WRITE,       /* spa_sync() */
-       ZIO_PRIORITY_SCRUB,             /* asynchronous scrub/resilver reads */
-       ZIO_PRIORITY_NUM_QUEUEABLE,
-
-       ZIO_PRIORITY_NOW                /* non-queued i/os (e.g. free) */
-} zio_priority_t;
-
 enum zio_flag {
        /*
         * Flags inherited by gang, ddt, and vdev children,
@@ -183,6 +169,7 @@ enum zio_flag {
        ZIO_FLAG_DONT_CACHE     = 1 << 11,
        ZIO_FLAG_NODATA         = 1 << 12,
        ZIO_FLAG_INDUCE_DAMAGE  = 1 << 13,
+       ZIO_FLAG_IO_ALLOCATING  = 1 << 14,
 
 #define        ZIO_FLAG_DDT_INHERIT    (ZIO_FLAG_IO_RETRY - 1)
 #define        ZIO_FLAG_GANG_INHERIT   (ZIO_FLAG_IO_RETRY - 1)
@@ -190,28 +177,28 @@ enum zio_flag {
        /*
         * Flags inherited by vdev children.
         */
-       ZIO_FLAG_IO_RETRY       = 1 << 14,      /* must be first for INHERIT */
-       ZIO_FLAG_PROBE          = 1 << 15,
-       ZIO_FLAG_TRYHARD        = 1 << 16,
-       ZIO_FLAG_OPTIONAL       = 1 << 17,
+       ZIO_FLAG_IO_RETRY       = 1 << 15,      /* must be first for INHERIT */
+       ZIO_FLAG_PROBE          = 1 << 16,
+       ZIO_FLAG_TRYHARD        = 1 << 17,
+       ZIO_FLAG_OPTIONAL       = 1 << 18,
 
 #define        ZIO_FLAG_VDEV_INHERIT   (ZIO_FLAG_DONT_QUEUE - 1)
 
        /*
         * Flags not inherited by any children.
         */
-       ZIO_FLAG_DONT_QUEUE     = 1 << 18,      /* must be first for INHERIT */
-       ZIO_FLAG_DONT_PROPAGATE = 1 << 19,
-       ZIO_FLAG_IO_BYPASS      = 1 << 20,
-       ZIO_FLAG_IO_REWRITE     = 1 << 21,
-       ZIO_FLAG_RAW            = 1 << 22,
-       ZIO_FLAG_GANG_CHILD     = 1 << 23,
-       ZIO_FLAG_DDT_CHILD      = 1 << 24,
-       ZIO_FLAG_GODFATHER      = 1 << 25,
-       ZIO_FLAG_NOPWRITE       = 1 << 26,
-       ZIO_FLAG_REEXECUTED     = 1 << 27,
-       ZIO_FLAG_DELEGATED      = 1 << 28,
-       ZIO_FLAG_FASTWRITE      = 1 << 29,
+       ZIO_FLAG_DONT_QUEUE     = 1 << 19,      /* must be first for INHERIT */
+       ZIO_FLAG_DONT_PROPAGATE = 1 << 20,
+       ZIO_FLAG_IO_BYPASS      = 1 << 21,
+       ZIO_FLAG_IO_REWRITE     = 1 << 22,
+       ZIO_FLAG_RAW            = 1 << 23,
+       ZIO_FLAG_GANG_CHILD     = 1 << 24,
+       ZIO_FLAG_DDT_CHILD      = 1 << 25,
+       ZIO_FLAG_GODFATHER      = 1 << 26,
+       ZIO_FLAG_NOPWRITE       = 1 << 27,
+       ZIO_FLAG_REEXECUTED     = 1 << 28,
+       ZIO_FLAG_DELEGATED      = 1 << 29,
+       ZIO_FLAG_FASTWRITE      = 1 << 30
 };
 
 #define        ZIO_FLAG_MUSTSUCCEED            0
@@ -251,6 +238,7 @@ enum zio_wait_type {
 
 typedef void zio_done_func_t(zio_t *zio);
 
+extern int zio_dva_throttle_enabled;
 extern const char *zio_type_name[ZIO_TYPES];
 
 /*
@@ -262,6 +250,7 @@ extern const char *zio_type_name[ZIO_TYPES];
  * Root blocks (objset_phys_t) are object 0, level -1:  <objset, 0, -1, 0>.
  * ZIL blocks are bookmarked <objset, 0, -2, blkid == ZIL sequence number>.
  * dmu_sync()ed ZIL data blocks are bookmarked <objset, object, -2, blkid>.
+ * dnode visit bookmarks are <objset, object id of dnode, -3, 0>.
  *
  * Note: this structure is called a bookmark because its original purpose
  * was to remember where to resume a pool-wide traverse.
@@ -294,6 +283,9 @@ struct zbookmark_phys {
 #define        ZB_ZIL_OBJECT           (0ULL)
 #define        ZB_ZIL_LEVEL            (-2LL)
 
+#define        ZB_DNODE_LEVEL          (-3LL)
+#define        ZB_DNODE_BLKID          (0ULL)
+
 #define        ZB_IS_ZERO(zb)                                          \
        ((zb)->zb_objset == 0 && (zb)->zb_object == 0 &&        \
        (zb)->zb_level == 0 && (zb)->zb_blkid == 0)
@@ -316,11 +308,12 @@ typedef struct zio_prop {
 typedef struct zio_cksum_report zio_cksum_report_t;
 
 typedef void zio_cksum_finish_f(zio_cksum_report_t *rep,
-    const void *good_data);
+    const abd_t *good_data);
 typedef void zio_cksum_free_f(void *cbdata, size_t size);
 
 struct zio_bad_cksum;                          /* defined in zio_checksum.h */
 struct dnode_phys;
+struct abd;
 
 struct zio_cksum_report {
        struct zio_cksum_report *zcr_next;
@@ -353,12 +346,12 @@ typedef struct zio_gang_node {
 } zio_gang_node_t;
 
 typedef zio_t *zio_gang_issue_func_t(zio_t *zio, blkptr_t *bp,
-    zio_gang_node_t *gn, void *data);
+    zio_gang_node_t *gn, struct abd *data, uint64_t offset);
 
-typedef void zio_transform_func_t(zio_t *zio, void *data, uint64_t size);
+typedef void zio_transform_func_t(zio_t *zio, struct abd *data, uint64_t size);
 
 typedef struct zio_transform {
-       void                    *zt_orig_data;
+       struct abd              *zt_orig_abd;
        uint64_t                zt_orig_size;
        uint64_t                zt_bufsize;
        zio_transform_func_t    *zt_transform;
@@ -377,6 +370,11 @@ typedef int zio_pipe_stage_t(zio_t *zio);
 #define        ZIO_REEXECUTE_NOW       0x01
 #define        ZIO_REEXECUTE_SUSPEND   0x02
 
+typedef struct zio_alloc_list {
+       list_t  zal_list;
+       uint64_t zal_size;
+} zio_alloc_list_t;
+
 typedef struct zio_link {
        zio_t           *zl_parent;
        zio_t           *zl_child;
@@ -401,21 +399,23 @@ struct zio {
        blkptr_t        io_bp_copy;
        list_t          io_parent_list;
        list_t          io_child_list;
-       zio_link_t      *io_walk_link;
        zio_t           *io_logical;
        zio_transform_t *io_transform_stack;
 
        /* Callback info */
-       zio_done_func_t *io_ready;
+       zio_done_func_t *io_ready;
+       zio_done_func_t *io_children_ready;
        zio_done_func_t *io_physdone;
        zio_done_func_t *io_done;
        void            *io_private;
        int64_t         io_prev_space_delta;    /* DMU private */
        blkptr_t        io_bp_orig;
+       /* io_lsize != io_orig_size iff this is a raw write */
+       uint64_t        io_lsize;
 
        /* Data represented by this I/O */
-       void            *io_data;
-       void            *io_orig_data;
+       struct abd      *io_abd;
+       struct abd      *io_orig_abd;
        uint64_t        io_size;
        uint64_t        io_orig_size;
 
@@ -426,10 +426,15 @@ struct zio {
 
        uint64_t        io_offset;
        hrtime_t        io_timestamp;   /* submitted at */
+       hrtime_t        io_queued_timestamp;
+       hrtime_t        io_target_timestamp;
        hrtime_t        io_delta;       /* vdev queue service delta */
-       uint64_t        io_delay;       /* vdev disk service delta (ticks) */
+       hrtime_t        io_delay;       /* Device access time (disk or */
+                                       /* file). */
        avl_node_t      io_queue_node;
        avl_node_t      io_offset_node;
+       avl_node_t      io_alloc_node;
+       zio_alloc_list_t        io_alloc_list;
 
        /* Internal pipeline state */
        enum zio_flag   io_flags;
@@ -438,6 +443,7 @@ struct zio {
        enum zio_flag   io_orig_flags;
        enum zio_stage  io_orig_stage;
        enum zio_stage  io_orig_pipeline;
+       enum zio_stage  io_pipeline_trace;
        int             io_error;
        int             io_child_error[ZIO_CHILD_TYPES];
        uint64_t        io_children[ZIO_CHILD_TYPES][ZIO_WAIT_TYPES];
@@ -460,24 +466,27 @@ struct zio {
        taskq_ent_t     io_tqent;
 };
 
+extern int zio_bookmark_compare(const void *, const void *);
+
 extern zio_t *zio_null(zio_t *pio, spa_t *spa, vdev_t *vd,
     zio_done_func_t *done, void *private, enum zio_flag flags);
 
 extern zio_t *zio_root(spa_t *spa,
     zio_done_func_t *done, void *private, enum zio_flag flags);
 
-extern zio_t *zio_read(zio_t *pio, spa_t *spa, const blkptr_t *bp, void *data,
-    uint64_t size, zio_done_func_t *done, void *private,
+extern zio_t *zio_read(zio_t *pio, spa_t *spa, const blkptr_t *bp,
+    struct abd *data, uint64_t lsize, zio_done_func_t *done, void *private,
     zio_priority_t priority, enum zio_flag flags, const zbookmark_phys_t *zb);
 
 extern zio_t *zio_write(zio_t *pio, spa_t *spa, uint64_t txg, blkptr_t *bp,
-    void *data, uint64_t size, const zio_prop_t *zp,
-    zio_done_func_t *ready, zio_done_func_t *physdone, zio_done_func_t *done,
-    void *private,
-    zio_priority_t priority, enum zio_flag flags, const zbookmark_phys_t *zb);
+    struct abd *data, uint64_t size, uint64_t psize, const zio_prop_t *zp,
+    zio_done_func_t *ready, zio_done_func_t *children_ready,
+    zio_done_func_t *physdone, zio_done_func_t *done,
+    void *private, zio_priority_t priority, enum zio_flag flags,
+    const zbookmark_phys_t *zb);
 
 extern zio_t *zio_rewrite(zio_t *pio, spa_t *spa, uint64_t txg, blkptr_t *bp,
-    void *data, uint64_t size, zio_done_func_t *done, void *private,
+    struct abd *data, uint64_t size, zio_done_func_t *done, void *private,
     zio_priority_t priority, enum zio_flag flags, zbookmark_phys_t *zb);
 
 extern void zio_write_override(zio_t *zio, blkptr_t *bp, int copies,
@@ -493,12 +502,12 @@ extern zio_t *zio_ioctl(zio_t *pio, spa_t *spa, vdev_t *vd, int cmd,
     zio_done_func_t *done, void *private, enum zio_flag flags);
 
 extern zio_t *zio_read_phys(zio_t *pio, vdev_t *vd, uint64_t offset,
-    uint64_t size, void *data, int checksum,
+    uint64_t size, struct abd *data, int checksum,
     zio_done_func_t *done, void *private, zio_priority_t priority,
     enum zio_flag flags, boolean_t labels);
 
 extern zio_t *zio_write_phys(zio_t *pio, vdev_t *vd, uint64_t offset,
-    uint64_t size, void *data, int checksum,
+    uint64_t size, struct abd *data, int checksum,
     zio_done_func_t *done, void *private, zio_priority_t priority,
     enum zio_flag flags, boolean_t labels);
 
@@ -506,7 +515,7 @@ extern zio_t *zio_free_sync(zio_t *pio, spa_t *spa, uint64_t txg,
     const blkptr_t *bp, enum zio_flag flags);
 
 extern int zio_alloc_zil(spa_t *spa, uint64_t txg, blkptr_t *new_bp,
-    uint64_t size, boolean_t use_slog);
+    uint64_t size, boolean_t *slog);
 extern void zio_free_zil(spa_t *spa, uint64_t txg, blkptr_t *bp);
 extern void zio_flush(zio_t *zio, vdev_t *vd);
 extern void zio_shrink(zio_t *zio, uint64_t size);
@@ -515,9 +524,11 @@ extern int zio_wait(zio_t *zio);
 extern void zio_nowait(zio_t *zio);
 extern void zio_execute(zio_t *zio);
 extern void zio_interrupt(zio_t *zio);
+extern void zio_delay_init(zio_t *zio);
+extern void zio_delay_interrupt(zio_t *zio);
 
-extern zio_t *zio_walk_parents(zio_t *cio);
-extern zio_t *zio_walk_children(zio_t *pio);
+extern zio_t *zio_walk_parents(zio_t *cio, zio_link_t **);
+extern zio_t *zio_walk_children(zio_t *pio, zio_link_t **);
 extern zio_t *zio_unique_parent(zio_t *cio);
 extern void zio_add_child(zio_t *pio, zio_t *cio);
 
@@ -525,17 +536,20 @@ extern void *zio_buf_alloc(size_t size);
 extern void zio_buf_free(void *buf, size_t size);
 extern void *zio_data_buf_alloc(size_t size);
 extern void zio_data_buf_free(void *buf, size_t size);
-extern void *zio_buf_alloc_flags(size_t size, int flags);
+
+extern void zio_push_transform(zio_t *zio, struct abd *abd, uint64_t size,
+    uint64_t bufsize, zio_transform_func_t *transform);
+extern void zio_pop_transforms(zio_t *zio);
 
 extern void zio_resubmit_stage_async(void *);
 
 extern zio_t *zio_vdev_child_io(zio_t *zio, blkptr_t *bp, vdev_t *vd,
-    uint64_t offset, void *data, uint64_t size, int type,
+    uint64_t offset, struct abd *data, uint64_t size, int type,
     zio_priority_t priority, enum zio_flag flags,
     zio_done_func_t *done, void *private);
 
 extern zio_t *zio_vdev_delegated_io(vdev_t *vd, uint64_t offset,
-    void *data, uint64_t size, int type, zio_priority_t priority,
+    struct abd *data, uint64_t size, int type, zio_priority_t priority,
     enum zio_flag flags, zio_done_func_t *done, void *private);
 
 extern void zio_vdev_io_bypass(zio_t *zio);
@@ -577,7 +591,7 @@ extern int zio_handle_fault_injection(zio_t *zio, int error);
 extern int zio_handle_device_injection(vdev_t *vd, zio_t *zio, int error);
 extern int zio_handle_label_injection(zio_t *zio, int error);
 extern void zio_handle_ignored_writes(zio_t *zio);
-extern uint64_t zio_handle_io_delay(zio_t *zio);
+extern hrtime_t zio_handle_io_delay(zio_t *zio);
 
 /*
  * Checksum ereport functions
@@ -585,22 +599,23 @@ extern uint64_t zio_handle_io_delay(zio_t *zio);
 extern void zfs_ereport_start_checksum(spa_t *spa, vdev_t *vd, struct zio *zio,
     uint64_t offset, uint64_t length, void *arg, struct zio_bad_cksum *info);
 extern void zfs_ereport_finish_checksum(zio_cksum_report_t *report,
-    const void *good_data, const void *bad_data, boolean_t drop_if_identical);
+    const abd_t *good_data, const abd_t *bad_data, boolean_t drop_if_identical);
 
-extern void zfs_ereport_send_interim_checksum(zio_cksum_report_t *report);
 extern void zfs_ereport_free_checksum(zio_cksum_report_t *report);
 
 /* If we have the good data in hand, this function can be used */
 extern void zfs_ereport_post_checksum(spa_t *spa, vdev_t *vd,
     struct zio *zio, uint64_t offset, uint64_t length,
-    const void *good_data, const void *bad_data, struct zio_bad_cksum *info);
+    const abd_t *good_data, const abd_t *bad_data, struct zio_bad_cksum *info);
 
 /* Called from spa_sync(), but primarily an injection handler */
 extern void spa_handle_ignored_writes(spa_t *spa);
 
 /* zbookmark_phys functions */
-boolean_t zbookmark_is_before(const struct dnode_phys *dnp,
-    const zbookmark_phys_t *zb1, const zbookmark_phys_t *zb2);
+boolean_t zbookmark_subtree_completed(const struct dnode_phys *dnp,
+    const zbookmark_phys_t *subtree_root, const zbookmark_phys_t *last_block);
+int zbookmark_compare(uint16_t dbss1, uint8_t ibs1, uint16_t dbss2,
+    uint8_t ibs2, const zbookmark_phys_t *zb1, const zbookmark_phys_t *zb2);
 
 #ifdef __cplusplus
 }