drm/amdkfd: avoid recursive lock in migrations back to RAM

author Alex Sierra <alex.sierra@amd.com>

Fri, 29 Oct 2021 18:30:40 +0000 (13:30 -0500)

committer Thomas Lamprecht <t.lamprecht@proxmox.com>

Wed, 14 Dec 2022 12:59:02 +0000 (13:59 +0100)
author Alex Sierra <alex.sierra@amd.com>
Fri, 29 Oct 2021 18:30:40 +0000 (13:30 -0500)
committer Thomas Lamprecht <t.lamprecht@proxmox.com>
Wed, 14 Dec 2022 12:59:02 +0000 (13:59 +0100)
diff --git a/drivers/gpu/drm/amd/amdkfd/kfd_migrate.c b/drivers/gpu/drm/amd/amdkfd/kfd_migrate.c

index 4a16e3c257b9268b4eb6ff2788a4685610ceaca6..a458c19b371ad2ccc072b728041f06d60fb759fc 100644 (file)
--- a/drivers/gpu/drm/amd/amdkfd/kfd_migrate.c
+++ b/drivers/gpu/drm/amd/amdkfd/kfd_migrate.c
@@ -796,6 +796,11 @@ static vm_fault_t svm_migrate_to_ram(struct vm_fault *vmf)
                 pr_debug("failed find process at fault address 0x%lx\n", addr);
                 return VM_FAULT_SIGBUS;
         }
+       if (READ_ONCE(p->svms.faulting_task) == current) {
+               pr_debug("skipping ram migration\n");
+               kfd_unref_process(p);
+               return 0;
+       }
         addr >>= PAGE_SHIFT;
         pr_debug("CPU page fault svms 0x%p address 0x%lx\n", &p->svms, addr);
  
diff --git a/drivers/gpu/drm/amd/amdkfd/kfd_priv.h b/drivers/gpu/drm/amd/amdkfd/kfd_priv.h

index 6d8f9bb2d9057310a2cb3ca47017592c94fae420..47ec820cae72b5580f6bae9a67ea2f3cded56b26 100644 (file)
--- a/drivers/gpu/drm/amd/amdkfd/kfd_priv.h
+++ b/drivers/gpu/drm/amd/amdkfd/kfd_priv.h
@@ -755,6 +755,7 @@ struct svm_range_list {
         atomic_t                        evicted_ranges;
         struct delayed_work             restore_work;
         DECLARE_BITMAP(bitmap_supported, MAX_GPU_INSTANCE);
+       struct task_struct              *faulting_task;
  };
  
  /* Process data */
diff --git a/drivers/gpu/drm/amd/amdkfd/kfd_svm.c b/drivers/gpu/drm/amd/amdkfd/kfd_svm.c

index 74e6f613be02067394935ded535a5cff3318b569..22a70aaccf13c645ec22ea439e8e3708cb49666c 100644 (file)
--- a/drivers/gpu/drm/amd/amdkfd/kfd_svm.c
+++ b/drivers/gpu/drm/amd/amdkfd/kfd_svm.c
@@ -1489,9 +1489,11 @@ static int svm_range_validate_and_map(struct mm_struct *mm,
  
                 next = min(vma->vm_end, end);
                 npages = (next - addr) >> PAGE_SHIFT;
+               WRITE_ONCE(p->svms.faulting_task, current);
                 r = amdgpu_hmm_range_get_pages(&prange->notifier, mm, NULL,
                                                addr, npages, &hmm_range,
                                                readonly, true, owner);
+               WRITE_ONCE(p->svms.faulting_task, NULL);
                 if (r) {
                         pr_debug("failed %d to get svm range pages\n", r);
                         goto unreserve_out;
author	Alex Sierra <alex.sierra@amd.com>
	Fri, 29 Oct 2021 18:30:40 +0000 (13:30 -0500)
committer	Thomas Lamprecht <t.lamprecht@proxmox.com>
	Wed, 14 Dec 2022 12:59:02 +0000 (13:59 +0100)
drivers/gpu/drm/amd/amdkfd/kfd_migrate.c		patch \| blob \| blame \| history
drivers/gpu/drm/amd/amdkfd/kfd_priv.h		patch \| blob \| blame \| history
drivers/gpu/drm/amd/amdkfd/kfd_svm.c		patch \| blob \| blame \| history