mm, memcg: fix reclaim deadlock with writeback

author Michal Hocko <mhocko@suse.com>

Tue, 8 Jan 2019 23:23:07 +0000 (15:23 -0800)

committer Linus Torvalds <torvalds@linux-foundation.org>

Wed, 9 Jan 2019 01:15:11 +0000 (17:15 -0800)
author Michal Hocko <mhocko@suse.com>
Tue, 8 Jan 2019 23:23:07 +0000 (15:23 -0800)
committer Linus Torvalds <torvalds@linux-foundation.org>
Wed, 9 Jan 2019 01:15:11 +0000 (17:15 -0800)
diff --git a/mm/memory.c b/mm/memory.c

index a52663c0612d4d1fb58a5be5ad34f4985ca80a89..5e46836714dc996e00582adea1462d78c7f5226d 100644 (file)
--- a/mm/memory.c
+++ b/mm/memory.c
@@ -2994,6 +2994,28 @@ static vm_fault_t __do_fault(struct vm_fault *vmf)
         struct vm_area_struct *vma = vmf->vma;
         vm_fault_t ret;
  
+       /*
+        * Preallocate pte before we take page_lock because this might lead to
+        * deadlocks for memcg reclaim which waits for pages under writeback:
+        *                              lock_page(A)
+        *                              SetPageWriteback(A)
+        *                              unlock_page(A)
+        * lock_page(B)
+        *                              lock_page(B)
+        * pte_alloc_pne
+        *   shrink_page_list
+        *     wait_on_page_writeback(A)
+        *                              SetPageWriteback(B)
+        *                              unlock_page(B)
+        *                              # flush A, B to clear the writeback
+        */
+       if (pmd_none(*vmf->pmd) && !vmf->prealloc_pte) {
+               vmf->prealloc_pte = pte_alloc_one(vmf->vma->vm_mm);
+               if (!vmf->prealloc_pte)
+                       return VM_FAULT_OOM;
+               smp_wmb(); /* See comment in __pte_alloc() */
+       }
+
         ret = vma->vm_ops->fault(vmf);
         if (unlikely(ret & (VM_FAULT_ERROR | VM_FAULT_NOPAGE | VM_FAULT_RETRY |
                             VM_FAULT_DONE_COW)))
author	Michal Hocko <mhocko@suse.com>
	Tue, 8 Jan 2019 23:23:07 +0000 (15:23 -0800)
committer	Linus Torvalds <torvalds@linux-foundation.org>
	Wed, 9 Jan 2019 01:15:11 +0000 (17:15 -0800)