]> git.proxmox.com Git - pve-storage.git/blobdiff - PVE/Diskmanage.pm
Diskmanage: add flag for encrypted osds
[pve-storage.git] / PVE / Diskmanage.pm
index 55df3f203b33de1f8b75b8a6001f91f5c59f76dc..2a0a01531363d7c5fea85dc9806236da48668838 100644 (file)
@@ -6,6 +6,7 @@ use PVE::ProcFSTools;
 use Data::Dumper;
 use Cwd qw(abs_path);
 use Fcntl ':mode';
+use JSON;
 
 use PVE::Tools qw(extract_param run_command file_get_contents file_read_firstline dir_glob_regex dir_glob_foreach trim);
 
@@ -13,7 +14,9 @@ my $SMARTCTL = "/usr/sbin/smartctl";
 my $ZPOOL = "/sbin/zpool";
 my $SGDISK = "/sbin/sgdisk";
 my $PVS = "/sbin/pvs";
+my $LVS = "/sbin/lvs";
 my $UDEVADM = "/bin/udevadm";
+my $LSBLK = "/bin/lsblk";
 
 sub verify_blockdev_path {
     my ($rel_path) = @_;
@@ -130,6 +133,10 @@ sub get_smart_data {
            } elsif (defined($type) && $type eq 'text') {
                $smartdata->{text} = '' if !defined $smartdata->{text};
                $smartdata->{text} .= "$line\n";
+               # extract wearout from nvme text, allow for decimal values
+               if ($line =~ m/Percentage Used:.*(\d+(?:\.\d+)?)\%/i) {
+                   $smartdata->{wearout} = 100 - $1;
+               }
            } elsif ($line =~ m/SMART Disabled/) {
                $smartdata->{health} = "SMART Disabled";
            }
@@ -149,10 +156,50 @@ sub get_smart_data {
     return $smartdata;
 }
 
+sub get_parttype_info() {
+    my $cmd = [$LSBLK, '--json', '-o', 'path,parttype'];
+    my $output = "";
+    my $res = {};
+    eval {
+       run_command($cmd, outfunc => sub {
+           my ($line) = @_;
+           $output .= "$line\n";
+       });
+    };
+    warn "$@\n" if $@;
+    return $res if $output eq '';
+
+    my $parsed = eval { decode_json($output) };
+    warn "$@\n" if $@;
+    my $list = $parsed->{blockdevices} // [];
+
+    foreach my $dev (@$list) {
+       next if !($dev->{parttype});
+       my $type = $dev->{parttype};
+       $res->{$type} = [] if !defined($res->{$type});
+       push @{$res->{$type}}, $dev->{path};
+    }
+
+    return $res;
+}
+
+my $get_devices_by_partuuid = sub {
+    my ($parttype_map, $uuids, $res) = @_;
+
+    $res = {} if !defined($res);
+
+    foreach my $uuid (sort keys %$uuids) {
+       map { $res->{$_} = $uuids->{$uuid} } @{$parttype_map->{$uuid}};
+    }
+
+    return $res;
+};
+
 sub get_zfs_devices {
-    my $list = {};
+    my ($parttype_map) = @_;
+    my $res = {};
 
-    return {} if !(-x $ZPOOL);
+    return {} if ! -x $ZPOOL;
 
     # use zpool and parttype uuid,
     # because log and cache do not have
@@ -162,7 +209,7 @@ sub get_zfs_devices {
             my ($line) = @_;
 
             if ($line =~ m|^\t([^\t]+)\t|) {
-               $list->{$1} = 1;
+               $res->{$1} = 1;
             }
        });
     };
@@ -171,26 +218,26 @@ sub get_zfs_devices {
     # because maybe zfs tools are not installed
     warn "$@\n" if $@;
 
-    my $applezfsuuid = "6a898cc3-1dd2-11b2-99a6-080020736631";
-    my $bsdzfsuuid = "516e7cba-6ecf-11d6-8ff8-00022d09712b";
+    my $uuids = {
+       "6a898cc3-1dd2-11b2-99a6-080020736631" => 1, # apple
+       "516e7cba-6ecf-11d6-8ff8-00022d09712b" => 1, # bsd
+    };
 
-    dir_glob_foreach('/dev/disk/by-parttypeuuid', "($applezfsuuid|$bsdzfsuuid)\..+", sub {
-       my ($entry) = @_;
-       my $real_dev = abs_path("/dev/disk/by-parttypeuuid/$entry");
-       $list->{$real_dev} = 1;
-    });
 
-    return $list;
+    $res = $get_devices_by_partuuid->($parttype_map, $uuids, $res);
+
+    return $res;
 }
 
 sub get_lvm_devices {
-    my $list = {};
+    my ($parttype_map) = @_;
+    my $res = {};
     eval {
        run_command([$PVS, '--noheadings', '--readonly', '-o', 'pv_name'], outfunc => sub{
            my ($line) = @_;
            $line = trim($line);
            if ($line =~ m|^/dev/|) {
-               $list->{$line} = 1;
+               $res->{$line} = 1;
            }
        });
     };
@@ -199,40 +246,63 @@ sub get_lvm_devices {
     # to give up, but indicate an error has occured
     warn "$@\n" if $@;
 
-    my $lvmuuid = "e6d6d379-f507-44c2-a23c-238f2a3df928";
+    my $uuids = {
+       "e6d6d379-f507-44c2-a23c-238f2a3df928" => 1,
+    };
 
-    dir_glob_foreach('/dev/disk/by-parttypeuuid', "$lvmuuid\..+", sub {
-       my ($entry) = @_;
-       my $real_dev = abs_path("/dev/disk/by-parttypeuuid/$entry");
-       $list->{$real_dev} = 1;
-    });
+    $res = $get_devices_by_partuuid->($parttype_map, $uuids, $res);
 
-    return $list;
+    return $res;
 }
 
 sub get_ceph_journals {
-    my $journalhash = {};
-
-    my $journal_uuid = '45b0969e-9b03-4f30-b4c6-b4b80ceff106';
-    my $db_uuid = '30cd0809-c2b2-499c-8879-2d6b78529876';
-    my $wal_uuid = '5ce17fce-4087-4169-b7ff-056cc58473f9';
-    my $block_uuid = 'cafecafe-9b03-4f30-b4c6-b4b80ceff106';
-
-    dir_glob_foreach('/dev/disk/by-parttypeuuid', "($journal_uuid|$db_uuid|$wal_uuid|$block_uuid)\..+", sub {
-       my ($entry, $type) = @_;
-       my $real_dev = abs_path("/dev/disk/by-parttypeuuid/$entry");
-       if ($type eq $journal_uuid) {
-           $journalhash->{$real_dev} = 1;
-       } elsif ($type eq $db_uuid) {
-           $journalhash->{$real_dev} = 2;
-       } elsif ($type eq $wal_uuid) {
-           $journalhash->{$real_dev} = 3;
-       } elsif ($type eq $block_uuid) {
-           $journalhash->{$real_dev} = 4;
+    my ($parttype_map) = @_;
+    my $res = {};
+
+    my $uuids = {
+       '45b0969e-9b03-4f30-b4c6-b4b80ceff106' => 1, # journal
+       '30cd0809-c2b2-499c-8879-2d6b78529876' => 2, # db
+       '5ce17fce-4087-4169-b7ff-056cc58473f9' => 3, # wal
+       'cafecafe-9b03-4f30-b4c6-b4b80ceff106' => 4, # block
+    };
+
+    $res = $get_devices_by_partuuid->($parttype_map, $uuids, $res);
+
+    return $res;
+}
+
+# reads the lv_tags and matches them with the devices
+sub get_ceph_volume_infos {
+    my $result = {};
+
+    my $cmd = [ $LVS, '-S', 'lv_name=~^osd-', '-o', 'devices,lv_name,lv_tags',
+              '--noheadings', '--readonly', '--separator', ';' ];
+
+    run_command($cmd, outfunc => sub {
+       my $line = shift;
+       $line =~ s/(?:^\s+)|(?:\s+$)//g; # trim whitespaces
+
+       my $fields = [ split(';', $line) ];
+
+       # lvs syntax is /dev/sdX(Y) where Y is the start (which we do not need)
+       my ($dev) = $fields->[0] =~ m|^(/dev/[a-z]+)|;
+       if ($fields->[1] =~ m|^osd-([^-]+)-|) {
+           my $type = $1;
+           # $result autovivification is wanted, to not creating empty hashes
+           if (($type eq 'block' || $type eq 'data') && $fields->[2] =~ m/ceph.osd_id=([^,]+)/) {
+               $result->{$dev}->{osdid} = $1;
+               $result->{$dev}->{bluestore} = ($type eq 'block');
+               if ($fields->[2] =~ m/ceph\.encrypted=1/) {
+                   $result->{$dev}->{encrypted} = 1;
+               }
+           } else {
+               # undef++ becomes '1' (see `perldoc perlop`: Auto-increment)
+               $result->{$dev}->{$type}++;
+           }
        }
     });
 
-    return $journalhash;
+    return $result;
 }
 
 sub get_udev_info {
@@ -320,7 +390,12 @@ sub get_sysdir_info {
 }
 
 sub get_wear_leveling_info {
-    my ($attributes, $model) = @_;
+    my ($smartdata, $model) = @_;
+    my $attributes = $smartdata->{attributes};
+
+    if (defined($smartdata->{wearout})) {
+       return $smartdata->{wearout};
+    }
 
     my $wearout;
 
@@ -384,7 +459,7 @@ sub is_iscsi {
 }
 
 sub get_disks {
-    my ($disk, $nosmart) = @_;
+    my ($disks, $nosmart) = @_;
     my $disklist = {};
 
     my $mounted = {};
@@ -401,20 +476,30 @@ sub get_disks {
        return $mounted->{$dev};
     };
 
-    my $journalhash = get_ceph_journals();
+    my $parttype_map = get_parttype_info();
+
+    my $journalhash = get_ceph_journals($parttype_map);
+    my $ceph_volume_infos = get_ceph_volume_infos();
 
-    my $zfslist = get_zfs_devices();
+    my $zfshash = get_zfs_devices($parttype_map);
 
-    my $lvmlist = get_lvm_devices();
+    my $lvmhash = get_lvm_devices($parttype_map);
+
+    my $disk_regex = ".*";
+    if (defined($disks)) {
+       if (!ref($disks)) {
+           $disks = [ $disks ];
+       } elsif (ref($disks) ne 'ARRAY') {
+           die "disks is not a string or array reference\n";
+       }
+       # we get cciss/c0d0 but need cciss!c0d0
+       map { s|cciss/|cciss!| } @$disks;
 
-    # we get cciss/c0d0 but need cciss!c0d0
-    if (defined($disk) && $disk =~ m|^cciss/|) {
-       $disk =~ s|cciss/|cciss!|;
+       $disk_regex = "(?:" . join('|', @$disks) . ")";
     }
 
-    dir_glob_foreach('/sys/block', '.*', sub {
+    dir_glob_foreach('/sys/block', $disk_regex, sub {
        my ($dev) = @_;
-       return if defined($disk) && $disk ne $dev;
        # whitelisting following devices
        # hdX: ide block device
        # sdX: sd block device
@@ -462,19 +547,19 @@ sub get_disks {
 
                if ($type eq 'ssd') {
                    # if we have an ssd we try to get the wearout indicator
-                   my $wearval = get_wear_leveling_info($smartdata->{attributes}, $data->{model} || $sysdir->{model});
-                   $wearout = $wearval if $wearval;
+                   my $wearval = get_wear_leveling_info($smartdata, $data->{model} || $sysdata->{model});
+                   $wearout = $wearval if defined($wearval);
                }
            };
        }
 
        my $used;
 
-       $used = 'LVM' if $lvmlist->{$devpath};
+       $used = 'LVM' if $lvmhash->{$devpath};
 
        $used = 'mounted' if &$dev_is_mounted($devpath);
 
-       $used = 'ZFS' if $zfslist->{$devpath};
+       $used = 'ZFS' if $zfshash->{$devpath};
 
        # we replaced cciss/ with cciss! above
        # but in the result we need cciss/ again
@@ -500,6 +585,7 @@ sub get_disks {
 
        my $osdid = -1;
        my $bluestore = 0;
+       my $osdencrypted = 0;
 
        my $journal_count = 0;
        my $db_count = 0;
@@ -529,19 +615,19 @@ sub get_disks {
                }
            }
 
-           if ($lvmlist->{"$partpath/$part"}) {
+           if ($lvmhash->{"$partpath/$part"}) {
                $found_lvm = 1;
            }
 
-           if ($zfslist->{"$partpath/$part"}) {
+           if ($zfshash->{"$partpath/$part"}) {
                $found_zfs = 1;
            }
 
-           if ($journalhash->{"$partpath/$part"}) {
-               $journal_count++ if $journalhash->{"$partpath/$part"} == 1;
-               $db_count++ if $journalhash->{"$partpath/$part"} == 2;
-               $wal_count++ if $journalhash->{"$partpath/$part"} == 3;
-               $bluestore = 1 if $journalhash->{"$partpath/$part"} == 4;
+           if (my $journal_part = $journalhash->{"$partpath/$part"}) {
+               $journal_count++ if $journal_part == 1;
+               $db_count++ if $journal_part == 2;
+               $wal_count++ if $journal_part == 3;
+               $bluestore = 1 if $journal_part == 4;
            }
 
            if (!dir_is_empty("$sysdir/$part/holders") && !$found_lvm)  {
@@ -549,6 +635,17 @@ sub get_disks {
            }
        });
 
+       if (my $ceph_volume = $ceph_volume_infos->{$devpath}) {
+           $journal_count += $ceph_volume->{journal} // 0;
+           $db_count += $ceph_volume->{db} // 0;
+           $wal_count += $ceph_volume->{wal} // 0;
+           if (defined($ceph_volume->{osdid})) {
+               $osdid = $ceph_volume->{osdid};
+               $bluestore = 1 if $ceph_volume->{bluestore};
+               $osdencrypted = 1 if $ceph_volume->{encrypted};
+           }
+       }
+
        $used = 'mounted' if $found_mountpoints && !$used;
        $used = 'LVM' if $found_lvm && !$used;
        $used = 'ZFS' if $found_zfs && !$used;
@@ -564,6 +661,7 @@ sub get_disks {
        $disklist->{$dev}->{osdid} = $osdid;
        $disklist->{$dev}->{journals} = $journal_count if $journal_count;
        $disklist->{$dev}->{bluestore} = $bluestore if $osdid != -1;
+       $disklist->{$dev}->{osdencrypted} = $osdencrypted if $osdid != -1;
        $disklist->{$dev}->{db} = $db_count if $db_count;
        $disklist->{$dev}->{wal} = $wal_count if $wal_count;
     });
@@ -630,4 +728,37 @@ sub assert_disk_unused {
     return undef;
 }
 
+sub append_partition {
+    my ($dev, $size) = @_;
+
+    my $devname = $dev;
+    $devname =~ s|^/dev/||;
+
+    my $newpartid = 1;
+    dir_glob_foreach("/sys/block/$devname", qr/\Q$devname\E.*?(\d+)/, sub {
+       my ($part, $partid) = @_;
+
+       if ($partid >= $newpartid) {
+           $newpartid = $partid + 1;
+       }
+    });
+
+    $size = PVE::Tools::convert_size($size, 'b' => 'mb');
+
+    run_command([ $SGDISK, '-n', "$newpartid:0:+${size}M", $dev ],
+               errmsg => "error creating partition '$newpartid' on '$dev'");
+
+    my $partition;
+
+    # loop again to detect the real partiton device which does not always follow
+    # a strict $devname$partition scheme like /dev/nvme0n1 -> /dev/nvme0n1p1
+    dir_glob_foreach("/sys/block/$devname", qr/\Q$devname\E.*$newpartid/, sub {
+       my ($part) = @_;
+
+       $partition = "/dev/$part";
+    });
+
+    return $partition;
+}
+
 1;