]> git.proxmox.com Git - mirror_zfs.git/commitdiff
DMU: Do not pre-read holes during write
authorAlexander Motin <mav@FreeBSD.org>
Wed, 11 Oct 2023 23:37:21 +0000 (19:37 -0400)
committerGitHub <noreply@github.com>
Wed, 11 Oct 2023 23:37:21 +0000 (16:37 -0700)
dmu_tx_check_ioerr() pre-reads blocks that are going to be dirtied
as part of transaction to both prefetch them and check for errors.
But it makes no sense to do it for holes, since there are no disk
reads to prefetch and there can be no errors.  On the other side
those blocks are anonymous, and they are freed immediately by the
dbuf_rele() without even being put into dbuf cache, so we just
burn CPU time on decompression and overheads and get absolutely
no result at the end.

Use of dbuf_hold_impl() with fail_sparse parameter allows to skip
the extra work, and on my tests with sequential 8KB writes to empty
ZVOL with 32KB blocks shows throughput increase from 1.7 to 2GB/s.

Reviewed-by: Brian Atkinson <batkinson@lanl.gov>
Reviewed-by: Brian Behlendorf <behlendorf1@llnl.gov>
Signed-off-by: Alexander Motin <mav@FreeBSD.org>
Sponsored by: iXsystems, Inc.
Closes #15371

module/zfs/dmu_tx.c

index 0eb8c17e331ab35c92230c96d37ea6f8e0a4df71..8451b5082e864c798e4e81006aaf058beb0bdfc6 100644 (file)
@@ -210,10 +210,12 @@ dmu_tx_check_ioerr(zio_t *zio, dnode_t *dn, int level, uint64_t blkid)
        dmu_buf_impl_t *db;
 
        rw_enter(&dn->dn_struct_rwlock, RW_READER);
-       db = dbuf_hold_level(dn, level, blkid, FTAG);
+       err = dbuf_hold_impl(dn, level, blkid, TRUE, FALSE, FTAG, &db);
        rw_exit(&dn->dn_struct_rwlock);
-       if (db == NULL)
-               return (SET_ERROR(EIO));
+       if (err == ENOENT)
+               return (0);
+       if (err != 0)
+               return (err);
        /*
         * PARTIAL_FIRST allows caching for uncacheable blocks.  It will
         * be cleared after dmu_buf_will_dirty() call dbuf_read() again.