drm/i915: Signal first fence from irq handler if complete

author Chris Wilson <chris@chris-wilson.co.uk>

Mon, 27 Feb 2017 20:58:48 +0000 (20:58 +0000)

committer Chris Wilson <chris@chris-wilson.co.uk>

Mon, 27 Feb 2017 21:57:20 +0000 (21:57 +0000)
author Chris Wilson <chris@chris-wilson.co.uk>
Mon, 27 Feb 2017 20:58:48 +0000 (20:58 +0000)
committer Chris Wilson <chris@chris-wilson.co.uk>
Mon, 27 Feb 2017 21:57:20 +0000 (21:57 +0000)
diff --git a/drivers/gpu/drm/i915/i915_drv.h b/drivers/gpu/drm/i915/i915_drv.h

index 933874ddea75272f8d0d8a6a442a87c2f299d975..71152656ebbfe46646f087a4e611703755c3af59 100644 (file)
--- a/drivers/gpu/drm/i915/i915_drv.h
+++ b/drivers/gpu/drm/i915/i915_drv.h
@@ -4060,9 +4060,9 @@ __i915_request_irq_complete(const struct drm_i915_gem_request *req)
          * is woken.
          */
         if (engine->irq_seqno_barrier &&
-           rcu_access_pointer(engine->breadcrumbs.irq_seqno_bh) == current &&
             test_and_clear_bit(ENGINE_IRQ_BREADCRUMB, &engine->irq_posted)) {
-               struct task_struct *tsk;
+               struct intel_breadcrumbs *b = &engine->breadcrumbs;
+               unsigned long flags;
  
                 /* The ordering of irq_posted versus applying the barrier
                  * is crucial. The clearing of the current irq_posted must
@@ -4084,17 +4084,16 @@ __i915_request_irq_complete(const struct drm_i915_gem_request *req)
                  * the seqno before we believe it coherent since they see
                  * irq_posted == false but we are still running).
                  */
-               rcu_read_lock();
-               tsk = rcu_dereference(engine->breadcrumbs.irq_seqno_bh);
-               if (tsk && tsk != current)
+               spin_lock_irqsave(&b->lock, flags);
+               if (b->first_wait && b->first_wait->tsk != current)
                         /* Note that if the bottom-half is changed as we
                          * are sending the wake-up, the new bottom-half will
                          * be woken by whomever made the change. We only have
                          * to worry about when we steal the irq-posted for
                          * ourself.
                          */
-                       wake_up_process(tsk);
-               rcu_read_unlock();
+                       wake_up_process(b->first_wait->tsk);
+               spin_unlock_irqrestore(&b->lock, flags);
  
                 if (__i915_gem_request_completed(req, seqno))
                         return true;
diff --git a/drivers/gpu/drm/i915/i915_gem_request.c b/drivers/gpu/drm/i915/i915_gem_request.c

index fbfeb5f8d069f8499167416605497cc079d72961..77c3ee7a3fd05bf4351075981c9dd87b5d142f14 100644 (file)
--- a/drivers/gpu/drm/i915/i915_gem_request.c
+++ b/drivers/gpu/drm/i915/i915_gem_request.c
@@ -1083,7 +1083,7 @@ long i915_wait_request(struct drm_i915_gem_request *req,
         if (flags & I915_WAIT_LOCKED)
                 add_wait_queue(errq, &reset);
  
-       intel_wait_init(&wait);
+       intel_wait_init(&wait, req);
  
  restart:
         do {
diff --git a/drivers/gpu/drm/i915/i915_gem_request.h b/drivers/gpu/drm/i915/i915_gem_request.h

index 5f73d8c0a38abdc79022c6665cb19e240bca3535..0efee879df23d9aa06818c31e43decb81b7bb31a 100644 (file)
--- a/drivers/gpu/drm/i915/i915_gem_request.h
+++ b/drivers/gpu/drm/i915/i915_gem_request.h
@@ -32,10 +32,12 @@
  
  struct drm_file;
  struct drm_i915_gem_object;
+struct drm_i915_gem_request;
  
  struct intel_wait {
         struct rb_node node;
         struct task_struct *tsk;
+       struct drm_i915_gem_request *request;
         u32 seqno;
  };
  
diff --git a/drivers/gpu/drm/i915/i915_irq.c b/drivers/gpu/drm/i915/i915_irq.c

index 312d30e96dc2c9894eef24fde3c85c7e514fff35..e06e6eb998014135d986f7ec84e78bca251be377 100644 (file)
--- a/drivers/gpu/drm/i915/i915_irq.c
+++ b/drivers/gpu/drm/i915/i915_irq.c
@@ -1033,12 +1033,42 @@ static void ironlake_rps_change_irq_handler(struct drm_i915_private *dev_priv)
  
  static void notify_ring(struct intel_engine_cs *engine)
  {
-       bool waiters;
+       struct drm_i915_gem_request *rq = NULL;
+       struct intel_wait *wait;
  
         atomic_inc(&engine->irq_count);
         set_bit(ENGINE_IRQ_BREADCRUMB, &engine->irq_posted);
-       waiters = intel_engine_wakeup(engine);
-       trace_intel_engine_notify(engine, waiters);
+
+       rcu_read_lock();
+
+       spin_lock(&engine->breadcrumbs.lock);
+       wait = engine->breadcrumbs.first_wait;
+       if (wait) {
+               /* We use a callback from the dma-fence to submit
+                * requests after waiting on our own requests. To
+                * ensure minimum delay in queuing the next request to
+                * hardware, signal the fence now rather than wait for
+                * the signaler to be woken up. We still wake up the
+                * waiter in order to handle the irq-seqno coherency
+                * issues (we may receive the interrupt before the
+                * seqno is written, see __i915_request_irq_complete())
+                * and to handle coalescing of multiple seqno updates
+                * and many waiters.
+                */
+               if (i915_seqno_passed(intel_engine_get_seqno(engine),
+                                     wait->seqno))
+                       rq = wait->request;
+
+               wake_up_process(wait->tsk);
+       }
+       spin_unlock(&engine->breadcrumbs.lock);
+
+       if (rq)
+               dma_fence_signal(&rq->fence);
+
+       rcu_read_unlock();
+
+       trace_intel_engine_notify(engine, wait);
  }
  
  static void vlv_c0_read(struct drm_i915_private *dev_priv,
diff --git a/drivers/gpu/drm/i915/intel_breadcrumbs.c b/drivers/gpu/drm/i915/intel_breadcrumbs.c

index c8361f35035067b144d7abd6b8b7c0eab3eb201c..e7f4a4c923a2608308f55bc3e9d97d5627f1c820 100644 (file)
--- a/drivers/gpu/drm/i915/intel_breadcrumbs.c
+++ b/drivers/gpu/drm/i915/intel_breadcrumbs.c
@@ -28,26 +28,18 @@
  
  unsigned int intel_engine_wakeup(struct intel_engine_cs *engine)
  {
+       struct intel_wait *wait;
+       unsigned long flags;
         unsigned int result = 0;
  
-       /* Note that for this not to dangerously chase a dangling pointer,
-        * we must hold the rcu_read_lock here.
-        *
-        * Also note that tsk is likely to be in !TASK_RUNNING state so an
-        * early test for tsk->state != TASK_RUNNING before wake_up_process()
-        * is unlikely to be beneficial.
-        */
-       if (intel_engine_has_waiter(engine)) {
-               struct task_struct *tsk;
-
+       spin_lock_irqsave(&engine->breadcrumbs.lock, flags);
+       wait = engine->breadcrumbs.first_wait;
+       if (wait) {
                 result = ENGINE_WAKEUP_WAITER;
-
-               rcu_read_lock();
-               tsk = rcu_dereference(engine->breadcrumbs.irq_seqno_bh);
-               if (tsk && !wake_up_process(tsk))
+               if (!wake_up_process(wait->tsk))
                         result |= ENGINE_WAKEUP_ACTIVE;
-               rcu_read_unlock();
         }
+       spin_unlock_irqrestore(&engine->breadcrumbs.lock, flags);
  
         return result;
  }
@@ -301,7 +293,6 @@ static bool __intel_engine_add_wait(struct intel_engine_cs *engine,
         }
         rb_link_node(&wait->node, parent, p);
         rb_insert_color(&wait->node, &b->waiters);
-       GEM_BUG_ON(!first && !rcu_access_pointer(b->irq_seqno_bh));
  
         if (completed) {
                 struct rb_node *next = rb_next(completed);
@@ -310,7 +301,6 @@ static bool __intel_engine_add_wait(struct intel_engine_cs *engine,
                 if (next && next != &wait->node) {
                         GEM_BUG_ON(first);
                         b->first_wait = to_wait(next);
-                       rcu_assign_pointer(b->irq_seqno_bh, b->first_wait->tsk);
                         /* As there is a delay between reading the current
                          * seqno, processing the completed tasks and selecting
                          * the next waiter, we may have missed the interrupt
@@ -337,7 +327,6 @@ static bool __intel_engine_add_wait(struct intel_engine_cs *engine,
         if (first) {
                 GEM_BUG_ON(rb_first(&b->waiters) != &wait->node);
                 b->first_wait = wait;
-               rcu_assign_pointer(b->irq_seqno_bh, wait->tsk);
                 /* After assigning ourselves as the new bottom-half, we must
                  * perform a cursory check to prevent a missed interrupt.
                  * Either we miss the interrupt whilst programming the hardware,
@@ -348,7 +337,6 @@ static bool __intel_engine_add_wait(struct intel_engine_cs *engine,
                  */
                 __intel_breadcrumbs_enable_irq(b);
         }
-       GEM_BUG_ON(!rcu_access_pointer(b->irq_seqno_bh));
         GEM_BUG_ON(!b->first_wait);
         GEM_BUG_ON(rb_first(&b->waiters) != &b->first_wait->node);
  
@@ -396,8 +384,6 @@ static void __intel_engine_remove_wait(struct intel_engine_cs *engine,
                 const int priority = wakeup_priority(b, wait->tsk);
                 struct rb_node *next;
  
-               GEM_BUG_ON(rcu_access_pointer(b->irq_seqno_bh) != wait->tsk);
-
                 /* We are the current bottom-half. Find the next candidate,
                  * the first waiter in the queue on the remaining oldest
                  * request. As multiple seqnos may complete in the time it
@@ -439,13 +425,11 @@ static void __intel_engine_remove_wait(struct intel_engine_cs *engine,
                          * exception rather than a seqno completion.
                          */
                         b->first_wait = to_wait(next);
-                       rcu_assign_pointer(b->irq_seqno_bh, b->first_wait->tsk);
                         if (b->first_wait->seqno != wait->seqno)
                                 __intel_breadcrumbs_enable_irq(b);
                         wake_up_process(b->first_wait->tsk);
                 } else {
                         b->first_wait = NULL;
-                       rcu_assign_pointer(b->irq_seqno_bh, NULL);
                         __intel_breadcrumbs_disable_irq(b);
                 }
         } else {
@@ -459,7 +443,6 @@ out:
         GEM_BUG_ON(b->first_wait == wait);
         GEM_BUG_ON(rb_first(&b->waiters) !=
                    (b->first_wait ? &b->first_wait->node : NULL));
-       GEM_BUG_ON(!rcu_access_pointer(b->irq_seqno_bh) ^ RB_EMPTY_ROOT(&b->waiters));
  }
  
  void intel_engine_remove_wait(struct intel_engine_cs *engine,
@@ -621,6 +604,7 @@ void intel_engine_enable_signaling(struct drm_i915_gem_request *request)
                 return;
  
         request->signaling.wait.tsk = b->signaler;
+       request->signaling.wait.request = request;
         request->signaling.wait.seqno = seqno;
         i915_gem_request_get(request);
  
diff --git a/drivers/gpu/drm/i915/intel_ringbuffer.h b/drivers/gpu/drm/i915/intel_ringbuffer.h

index 7d753dc1b89dc0b7b4c37ae04309ced56580b3d0..974ec11d2b1d5315243160597471a0e6e1f28c4b 100644 (file)
--- a/drivers/gpu/drm/i915/intel_ringbuffer.h
+++ b/drivers/gpu/drm/i915/intel_ringbuffer.h
@@ -235,8 +235,6 @@ struct intel_engine_cs {
          * the overhead of waking that client is much preferred.
          */
         struct intel_breadcrumbs {
-               struct task_struct __rcu *irq_seqno_bh; /* bh for interrupts */
-
                 spinlock_t lock; /* protects the lists of requests; irqsafe */
                 struct rb_root waiters; /* sorted by retirement, priority */
                 struct rb_root signals; /* sorted by retirement */
@@ -582,9 +580,11 @@ static inline u32 intel_hws_seqno_address(struct intel_engine_cs *engine)
  /* intel_breadcrumbs.c -- user interrupt bottom-half for waiters */
  int intel_engine_init_breadcrumbs(struct intel_engine_cs *engine);
  
-static inline void intel_wait_init(struct intel_wait *wait)
+static inline void intel_wait_init(struct intel_wait *wait,
+                                  struct drm_i915_gem_request *rq)
  {
         wait->tsk = current;
+       wait->request = rq;
  }
  
  static inline void intel_wait_init_for_seqno(struct intel_wait *wait, u32 seqno)
@@ -639,7 +639,7 @@ void intel_engine_cancel_signaling(struct drm_i915_gem_request *request);
  
  static inline bool intel_engine_has_waiter(const struct intel_engine_cs *engine)
  {
-       return rcu_access_pointer(engine->breadcrumbs.irq_seqno_bh);
+       return READ_ONCE(engine->breadcrumbs.first_wait);
  }
  
  unsigned int intel_engine_wakeup(struct intel_engine_cs *engine);
author	Chris Wilson <chris@chris-wilson.co.uk>
	Mon, 27 Feb 2017 20:58:48 +0000 (20:58 +0000)
committer	Chris Wilson <chris@chris-wilson.co.uk>
	Mon, 27 Feb 2017 21:57:20 +0000 (21:57 +0000)
drivers/gpu/drm/i915/i915_drv.h		patch \| blob \| blame \| history
drivers/gpu/drm/i915/i915_gem_request.c		patch \| blob \| blame \| history
drivers/gpu/drm/i915/i915_gem_request.h		patch \| blob \| blame \| history
drivers/gpu/drm/i915/i915_irq.c		patch \| blob \| blame \| history
drivers/gpu/drm/i915/intel_breadcrumbs.c		patch \| blob \| blame \| history
drivers/gpu/drm/i915/intel_ringbuffer.h		patch \| blob \| blame \| history