]> git.proxmox.com Git - mirror_zfs.git/blobdiff - include/sys/zfs_znode.h
ztest: scrub ddt repair
[mirror_zfs.git] / include / sys / zfs_znode.h
index 9d12a118ec31c5a6297af4176c477817a26f4026..2dfcf453a53174bb5c1b1c7fca8a18a4aa0d7106 100644 (file)
@@ -20,6 +20,8 @@
  */
 /*
  * Copyright (c) 2005, 2010, Oracle and/or its affiliates. All rights reserved.
+ * Copyright (c) 2012, 2018 by Delphix. All rights reserved.
+ * Copyright 2016 Nexenta Systems, Inc. All rights reserved.
  */
 
 #ifndef        _SYS_FS_ZFS_ZNODE_H
@@ -28,7 +30,6 @@
 #ifdef _KERNEL
 #include <sys/isa_defs.h>
 #include <sys/types32.h>
-#include <sys/attr.h>
 #include <sys/list.h>
 #include <sys/dmu.h>
 #include <sys/sa.h>
 #include <sys/rrwlock.h>
 #include <sys/zfs_sa.h>
 #include <sys/zfs_stat.h>
+#include <sys/zfs_rlock.h>
 #endif
 #include <sys/zfs_acl.h>
 #include <sys/zil.h>
+#include <sys/zfs_project.h>
 
 #ifdef __cplusplus
 extern "C" {
@@ -57,19 +60,31 @@ extern "C" {
 #define        ZFS_APPENDONLY          0x0000004000000000ull
 #define        ZFS_NODUMP              0x0000008000000000ull
 #define        ZFS_OPAQUE              0x0000010000000000ull
-#define        ZFS_AV_QUARANTINED      0x0000020000000000ull
-#define        ZFS_AV_MODIFIED         0x0000040000000000ull
+#define        ZFS_AV_QUARANTINED      0x0000020000000000ull
+#define        ZFS_AV_MODIFIED         0x0000040000000000ull
 #define        ZFS_REPARSE             0x0000080000000000ull
 #define        ZFS_OFFLINE             0x0000100000000000ull
 #define        ZFS_SPARSE              0x0000200000000000ull
 
+/*
+ * PROJINHERIT attribute is used to indicate that the child object under the
+ * directory which has the PROJINHERIT attribute needs to inherit its parent
+ * project ID that is used by project quota.
+ */
+#define        ZFS_PROJINHERIT         0x0000400000000000ull
+
+/*
+ * PROJID attr is used internally to indicate that the object has project ID.
+ */
+#define        ZFS_PROJID              0x0000800000000000ull
+
 #define        ZFS_ATTR_SET(zp, attr, value, pflags, tx) \
 { \
        if (value) \
                pflags |= attr; \
        else \
                pflags &= ~attr; \
-       VERIFY(0 == sa_update(zp->z_sa_hdl, SA_ZPL_FLAGS(zp->z_sb), \
+       VERIFY(0 == sa_update(zp->z_sa_hdl, SA_ZPL_FLAGS(ZTOZSB(zp)), \
            &pflags, sizeof (pflags), tx)); \
 }
 
@@ -78,8 +93,8 @@ extern "C" {
  */
 #define        ZFS_XATTR               0x1             /* is an extended attribute */
 #define        ZFS_INHERIT_ACE         0x2             /* ace has inheritable ACEs */
-#define        ZFS_ACL_TRIVIAL         0x4             /* files ACL is trivial */
-#define        ZFS_ACL_OBJ_ACE         0x8             /* ACL has CMPLX Object ACE */
+#define        ZFS_ACL_TRIVIAL         0x4             /* files ACL is trivial */
+#define        ZFS_ACL_OBJ_ACE         0x8             /* ACL has CMPLX Object ACE */
 #define        ZFS_ACL_PROTECTED       0x10            /* ACL protected */
 #define        ZFS_ACL_DEFAULTED       0x20            /* ACL should be defaulted */
 #define        ZFS_ACL_AUTO_INHERIT    0x40            /* ACL should be inherited */
@@ -105,7 +120,9 @@ extern "C" {
 #define        SA_ZPL_FLAGS(z)         z->z_attr_table[ZPL_FLAGS]
 #define        SA_ZPL_SIZE(z)          z->z_attr_table[ZPL_SIZE]
 #define        SA_ZPL_ZNODE_ACL(z)     z->z_attr_table[ZPL_ZNODE_ACL]
+#define        SA_ZPL_DXATTR(z)        z->z_attr_table[ZPL_DXATTR]
 #define        SA_ZPL_PAD(z)           z->z_attr_table[ZPL_PAD]
+#define        SA_ZPL_PROJID(z)        z->z_attr_table[ZPL_PROJID]
 
 /*
  * Is ID ephemeral?
@@ -124,7 +141,7 @@ extern "C" {
 
 /*
  * Special attributes for master node.
- * "userquota@" and "groupquota@" are also valid (from
+ * "userquota@", "groupquota@" and "projectquota@" are also valid (from
  * zfs_userquota_prop_prefixes[]).
  */
 #define        ZFS_FSID                "FSID"
@@ -135,18 +152,6 @@ extern "C" {
 #define        ZFS_SHARES_DIR          "SHARES"
 #define        ZFS_SA_ATTRS            "SA_ATTRS"
 
-#define        ZFS_MAX_BLOCKSIZE       (SPA_MAXBLOCKSIZE)
-
-/* Path component length */
-/*
- * The generic fs code uses MAXNAMELEN to represent
- * what the largest component length is.  Unfortunately,
- * this length includes the terminating NULL.  ZFS needs
- * to tell the users via pathconf() and statvfs() what the
- * true maximum length of a component is, excluding the NULL.
- */
-#define        ZFS_MAXNAMELEN  (MAXNAMELEN - 1)
-
 /*
  * Convert mode bits (zp_mode) to BSD-style DT_* values for storing in
  * the directory entries.  On Linux systems this value is already
@@ -186,8 +191,7 @@ typedef struct znode {
        krwlock_t       z_parent_lock;  /* parent lock for directories */
        krwlock_t       z_name_lock;    /* "master" lock for dirent locks */
        zfs_dirlock_t   *z_dirlocks;    /* directory entry lock list */
-       kmutex_t        z_range_lock;   /* protects changes to z_range_avl */
-       avl_tree_t      z_range_avl;    /* avl tree of file range locks */
+       rangelock_t     z_rangelock;    /* file range locks */
        uint8_t         z_unlinked;     /* file has been unlinked */
        uint8_t         z_atime_dirty;  /* atime needs to be synced */
        uint8_t         z_zn_prefetch;  /* Prefetch znodes? */
@@ -195,25 +199,39 @@ typedef struct znode {
        uint_t          z_blksz;        /* block size in bytes */
        uint_t          z_seq;          /* modification sequence number */
        uint64_t        z_mapcnt;       /* number of pages mapped to file */
-       uint64_t        z_gen;          /* generation (cached) */
+       uint64_t        z_dnodesize;    /* dnode size */
        uint64_t        z_size;         /* file size (cached) */
-       uint64_t        z_atime[2];     /* atime (cached) */
-       uint64_t        z_links;        /* file links (cached) */
        uint64_t        z_pflags;       /* pflags (cached) */
-       uint64_t        z_uid;          /* uid fuid (cached) */
-       uint64_t        z_gid;          /* gid fuid (cached) */
-       mode_t          z_mode;         /* mode (cached) */
        uint32_t        z_sync_cnt;     /* synchronous open count */
+       mode_t          z_mode;         /* mode (cached) */
        kmutex_t        z_acl_lock;     /* acl data lock */
        zfs_acl_t       *z_acl_cached;  /* cached acl */
+       krwlock_t       z_xattr_lock;   /* xattr data lock */
+       nvlist_t        *z_xattr_cached; /* cached xattrs */
+       uint64_t        z_xattr_parent; /* parent obj for this xattr */
+       uint64_t        z_projid;       /* project ID */
        list_node_t     z_link_node;    /* all znodes in fs link */
        sa_handle_t     *z_sa_hdl;      /* handle to sa data */
        boolean_t       z_is_sa;        /* are we native sa? */
-       boolean_t       z_is_zvol;      /* are we used by the zvol */
        boolean_t       z_is_mapped;    /* are we mmap'ed */
+       boolean_t       z_is_ctldir;    /* are we .zfs entry */
+       boolean_t       z_is_stale;     /* are we stale due to rollback? */
        struct inode    z_inode;        /* generic vfs inode */
 } znode_t;
 
+typedef struct znode_hold {
+       uint64_t        zh_obj;         /* object id */
+       kmutex_t        zh_lock;        /* lock serializing object access */
+       avl_node_t      zh_node;        /* avl tree linkage */
+       zfs_refcount_t  zh_refcount;    /* active consumer reference count */
+} znode_hold_t;
+
+static inline uint64_t
+zfs_inherit_projid(znode_t *dzp)
+{
+       return ((dzp->z_pflags & ZFS_PROJINHERIT) ? dzp->z_projid :
+           ZFS_DEFAULT_PROJID);
+}
 
 /*
  * Range locking rules
@@ -236,65 +254,80 @@ typedef struct znode {
  */
 #define        ZTOI(znode)     (&((znode)->z_inode))
 #define        ITOZ(inode)     (container_of((inode), znode_t, z_inode))
-#define VTOZSB(vfs)    ((zfs_sb_t *)((vfs)->mnt_sb->s_fs_info))
-#define ZTOZSB(znode)  ((zfs_sb_t *)(ZTOI(znode)->i_sb->s_fs_info))
-#define ITOZSB(inode)  ((zfs_sb_t *)((inode)->i_sb->s_fs_info))
+#define        ZTOZSB(znode)   ((zfsvfs_t *)(ZTOI(znode)->i_sb->s_fs_info))
+#define        ITOZSB(inode)   ((zfsvfs_t *)((inode)->i_sb->s_fs_info))
 
 #define        S_ISDEV(mode)   (S_ISCHR(mode) || S_ISBLK(mode) || S_ISFIFO(mode))
 
-/*
- * ZFS_ENTER() is called on entry to each ZFS inode and vfs operation.
- * ZFS_EXIT() must be called before exitting the vop.
- * ZFS_VERIFY_ZP() verifies the znode is valid.
- */
-#define        ZFS_ENTER(zsb) \
-       { \
-               rrw_enter(&(zsb)->z_teardown_lock, RW_READER, FTAG); \
-               if ((zsb)->z_unmounted) { \
-                       ZFS_EXIT(zsb); \
-                       return (EIO); \
-               } \
-       }
-
-#define        ZFS_EXIT(zsb) \
-       { \
-               rrw_exit(&(zsb)->z_teardown_lock, FTAG); \
-               tsd_exit(); \
-       }
-
-#define        ZFS_VERIFY_ZP(zp) \
-       if ((zp)->z_sa_hdl == NULL) { \
-               ZFS_EXIT(ZTOZSB(zp)); \
-               return (EIO); \
-       }
+/* Called on entry to each ZFS inode and vfs operation. */
+#define        ZFS_ENTER_ERROR(zfsvfs, error)                          \
+do {                                                           \
+       rrm_enter_read(&(zfsvfs)->z_teardown_lock, FTAG);       \
+       if ((zfsvfs)->z_unmounted) {                            \
+               ZFS_EXIT(zfsvfs);                               \
+               return (error);                                 \
+       }                                                       \
+} while (0)
+#define        ZFS_ENTER(zfsvfs)       ZFS_ENTER_ERROR(zfsvfs, EIO)
+#define        ZPL_ENTER(zfsvfs)       ZFS_ENTER_ERROR(zfsvfs, -EIO)
+
+/* Must be called before exiting the operation. */
+#define        ZFS_EXIT(zfsvfs)                                        \
+do {                                                           \
+       rrm_exit(&(zfsvfs)->z_teardown_lock, FTAG);             \
+} while (0)
+#define        ZPL_EXIT(zfsvfs)        ZFS_EXIT(zfsvfs)
+
+/* Verifies the znode is valid. */
+#define        ZFS_VERIFY_ZP_ERROR(zp, error)                          \
+do {                                                           \
+       if ((zp)->z_sa_hdl == NULL) {                           \
+               ZFS_EXIT(ZTOZSB(zp));                           \
+               return (error);                                 \
+       }                                                       \
+} while (0)
+#define        ZFS_VERIFY_ZP(zp)       ZFS_VERIFY_ZP_ERROR(zp, EIO)
+#define        ZPL_VERIFY_ZP(zp)       ZFS_VERIFY_ZP_ERROR(zp, -EIO)
 
 /*
  * Macros for dealing with dmu_buf_hold
  */
-#define        ZFS_OBJ_HASH(obj_num)   ((obj_num) & (ZFS_OBJ_MTX_SZ - 1))
-#define        ZFS_OBJ_MUTEX(zsb, obj_num)     \
-       (&(zsb)->z_hold_mtx[ZFS_OBJ_HASH(obj_num)])
-#define        ZFS_OBJ_HOLD_ENTER(zsb, obj_num) \
-       mutex_enter(ZFS_OBJ_MUTEX((zsb), (obj_num)))
-#define        ZFS_OBJ_HOLD_TRYENTER(zsb, obj_num) \
-       mutex_tryenter(ZFS_OBJ_MUTEX((zsb), (obj_num)))
-#define        ZFS_OBJ_HOLD_EXIT(zsb, obj_num) \
-       mutex_exit(ZFS_OBJ_MUTEX((zsb), (obj_num)))
+#define        ZFS_OBJ_MTX_SZ          64
+#define        ZFS_OBJ_MTX_MAX         (1024 * 1024)
+#define        ZFS_OBJ_HASH(zfsvfs, obj)       ((obj) & ((zfsvfs->z_hold_size) - 1))
+
+extern unsigned int zfs_object_mutex_size;
 
 /*
- * Macros to encode/decode ZFS stored time values from/to struct timespec
+ * Encode ZFS stored time values from a struct timespec / struct timespec64.
  */
 #define        ZFS_TIME_ENCODE(tp, stmp)               \
-{                                              \
+do {                                           \
        (stmp)[0] = (uint64_t)(tp)->tv_sec;     \
        (stmp)[1] = (uint64_t)(tp)->tv_nsec;    \
-}
+} while (0)
 
+#if defined(HAVE_INODE_TIMESPEC64_TIMES)
+/*
+ * Decode ZFS stored time values to a struct timespec64
+ * 4.18 and newer kernels.
+ */
 #define        ZFS_TIME_DECODE(tp, stmp)               \
-{                                              \
-       (tp)->tv_sec = (time_t)(stmp)[0];               \
-       (tp)->tv_nsec = (long)(stmp)[1];                \
-}
+do {                                           \
+       (tp)->tv_sec = (time64_t)(stmp)[0];     \
+       (tp)->tv_nsec = (long)(stmp)[1];        \
+} while (0)
+#else
+/*
+ * Decode ZFS stored time values to a struct timespec
+ * 4.17 and older kernels.
+ */
+#define        ZFS_TIME_DECODE(tp, stmp)               \
+do {                                           \
+       (tp)->tv_sec = (time_t)(stmp)[0];       \
+       (tp)->tv_nsec = (long)(stmp)[1];        \
+} while (0)
+#endif /* HAVE_INODE_TIMESPEC64_TIMES */
 
 /*
  * Timestamp defines
@@ -303,34 +336,33 @@ typedef struct znode {
 #define        STATE_CHANGED           (ATTR_CTIME)
 #define        CONTENT_MODIFIED        (ATTR_MTIME | ATTR_CTIME)
 
-#define        ZFS_ACCESSTIME_STAMP(zsb, zp) \
-       if ((zsb)->z_atime && !((zsb)->z_vfs->mnt_flags & MNT_READONLY)) \
-               zfs_tstamp_update_setup(zp, ACCESSED, NULL, NULL, B_FALSE);
-
-extern int     zfs_init_fs(zfs_sb_t *, znode_t **);
+extern int     zfs_init_fs(zfsvfs_t *, znode_t **);
 extern void    zfs_set_dataprop(objset_t *);
 extern void    zfs_create_fs(objset_t *os, cred_t *cr, nvlist_t *,
     dmu_tx_t *tx);
 extern void    zfs_tstamp_update_setup(znode_t *, uint_t, uint64_t [2],
-    uint64_t [2], boolean_t);
+    uint64_t [2]);
 extern void    zfs_grow_blocksize(znode_t *, uint64_t, dmu_tx_t *);
 extern int     zfs_freesp(znode_t *, uint64_t, uint64_t, int, boolean_t);
 extern void    zfs_znode_init(void);
 extern void    zfs_znode_fini(void);
-extern int     zfs_zget(zfs_sb_t *, uint64_t, znode_t **);
+extern int     zfs_znode_hold_compare(const void *, const void *);
+extern int     zfs_zget(zfsvfs_t *, uint64_t, znode_t **);
 extern int     zfs_rezget(znode_t *);
 extern void    zfs_zinactive(znode_t *);
 extern void    zfs_znode_delete(znode_t *, dmu_tx_t *);
 extern void    zfs_remove_op_tables(void);
 extern int     zfs_create_op_tables(void);
-extern int     zfs_sync(zfs_sb_t *, short, cred_t *);
+extern int     zfs_sync(struct super_block *, int, cred_t *);
 extern dev_t   zfs_cmpldev(uint64_t);
 extern int     zfs_get_zplprop(objset_t *os, zfs_prop_t prop, uint64_t *value);
 extern int     zfs_get_stats(objset_t *os, nvlist_t *nv);
+extern boolean_t zfs_get_vfs_flag_unmounted(objset_t *os);
 extern void    zfs_znode_dmu_fini(znode_t *);
 extern int     zfs_inode_alloc(struct super_block *, struct inode **ip);
 extern void    zfs_inode_destroy(struct inode *);
 extern void    zfs_inode_update(znode_t *);
+extern void    zfs_mark_inode_dirty(struct inode *);
 
 extern void zfs_log_create(zilog_t *zilog, dmu_tx_t *tx, uint64_t txtype,
     znode_t *dzp, znode_t *zp, char *name, vsecattr_t *, zfs_fuid_info_t *,
@@ -347,17 +379,16 @@ extern void zfs_log_symlink(zilog_t *zilog, dmu_tx_t *tx, uint64_t txtype,
 extern void zfs_log_rename(zilog_t *zilog, dmu_tx_t *tx, uint64_t txtype,
     znode_t *sdzp, char *sname, znode_t *tdzp, char *dname, znode_t *szp);
 extern void zfs_log_write(zilog_t *zilog, dmu_tx_t *tx, int txtype,
-    znode_t *zp, offset_t off, ssize_t len, int ioflag);
+    znode_t *zp, offset_t off, ssize_t len, int ioflag,
+    zil_callback_t callback, void *callback_data);
 extern void zfs_log_truncate(zilog_t *zilog, dmu_tx_t *tx, int txtype,
     znode_t *zp, uint64_t off, uint64_t len);
 extern void zfs_log_setattr(zilog_t *zilog, dmu_tx_t *tx, int txtype,
-    znode_t *zp, struct iattr *attr, uint_t mask_applied,
-    zfs_fuid_info_t *fuidp);
+    znode_t *zp, vattr_t *vap, uint_t mask_applied, zfs_fuid_info_t *fuidp);
 extern void zfs_log_acl(zilog_t *zilog, dmu_tx_t *tx, znode_t *zp,
     vsecattr_t *vsecp, zfs_fuid_info_t *fuidp);
 extern void zfs_xvattr_set(znode_t *zp, xvattr_t *xvap, dmu_tx_t *tx);
-extern void zfs_upgrade(zfs_sb_t *zsb, dmu_tx_t *tx);
-extern int zfs_create_share_dir(zfs_sb_t *zsb, dmu_tx_t *tx);
+extern void zfs_upgrade(zfsvfs_t *zfsvfs, dmu_tx_t *tx);
 
 #if defined(HAVE_UIO_RW)
 extern caddr_t zfs_map_page(page_t *, enum seg_rw);