sched/cputime: Fix clock_nanosleep()/clock_gettime() inconsistency

author Stanislaw Gruszka <sgruszka@redhat.com>

Wed, 12 Nov 2014 15:58:44 +0000 (16:58 +0100)

committer Ingo Molnar <mingo@kernel.org>

Sun, 16 Nov 2014 09:04:20 +0000 (10:04 +0100)
author Stanislaw Gruszka <sgruszka@redhat.com>
Wed, 12 Nov 2014 15:58:44 +0000 (16:58 +0100)
committer Ingo Molnar <mingo@kernel.org>
Sun, 16 Nov 2014 09:04:20 +0000 (10:04 +0100)
diff --git a/kernel/sched/core.c b/kernel/sched/core.c

index 797a6c84c48d15517876ce7d56dc085aeb41e62a..24beb9bb4c3e228ac17e8b931f37c44091987d18 100644 (file)
--- a/kernel/sched/core.c
+++ b/kernel/sched/core.c
@@ -2474,31 +2474,6 @@ DEFINE_PER_CPU(struct kernel_cpustat, kernel_cpustat);
  EXPORT_PER_CPU_SYMBOL(kstat);
  EXPORT_PER_CPU_SYMBOL(kernel_cpustat);
  
-/*
- * Return any ns on the sched_clock that have not yet been accounted in
- * @p in case that task is currently running.
- *
- * Called with task_rq_lock() held on @rq.
- */
-static u64 do_task_delta_exec(struct task_struct *p, struct rq *rq)
-{
-       u64 ns = 0;
-
-       /*
-        * Must be ->curr _and_ ->on_rq.  If dequeued, we would
-        * project cycles that may never be accounted to this
-        * thread, breaking clock_gettime().
-        */
-       if (task_current(rq, p) && task_on_rq_queued(p)) {
-               update_rq_clock(rq);
-               ns = rq_clock_task(rq) - p->se.exec_start;
-               if ((s64)ns < 0)
-                       ns = 0;
-       }
-
-       return ns;
-}
-
  /*
   * Return accounted runtime for the task.
   * In case the task is currently running, return the runtime plus current's
@@ -2508,7 +2483,7 @@ unsigned long long task_sched_runtime(struct task_struct *p)
  {
         unsigned long flags;
         struct rq *rq;
-       u64 ns = 0;
+       u64 ns;
  
  #if defined(CONFIG_64BIT) && defined(CONFIG_SMP)
         /*
@@ -2527,7 +2502,16 @@ unsigned long long task_sched_runtime(struct task_struct *p)
  #endif
  
         rq = task_rq_lock(p, &flags);
-       ns = p->se.sum_exec_runtime + do_task_delta_exec(p, rq);
+       /*
+        * Must be ->curr _and_ ->on_rq.  If dequeued, we would
+        * project cycles that may never be accounted to this
+        * thread, breaking clock_gettime().
+        */
+       if (task_current(rq, p) && task_on_rq_queued(p)) {
+               update_rq_clock(rq);
+               p->sched_class->update_curr(rq);
+       }
+       ns = p->se.sum_exec_runtime;
         task_rq_unlock(rq, p, &flags);
  
         return ns;
diff --git a/kernel/sched/deadline.c b/kernel/sched/deadline.c

index 5285332392d5b599788a90faa37615ccddc386d5..28fa9d9e92012a9245b2e95ce85bf301d320f8cc 100644 (file)
--- a/kernel/sched/deadline.c
+++ b/kernel/sched/deadline.c
@@ -1701,4 +1701,6 @@ const struct sched_class dl_sched_class = {
         .prio_changed           = prio_changed_dl,
         .switched_from          = switched_from_dl,
         .switched_to            = switched_to_dl,
+
+       .update_curr            = update_curr_dl,
  };
diff --git a/kernel/sched/fair.c b/kernel/sched/fair.c

index 3af3d1e7df9b728dd3ab69d0ffd481d48a9f158b..ef2b104b254cb8c60d954a92e62f0f8a626ed024 100644 (file)
--- a/kernel/sched/fair.c
+++ b/kernel/sched/fair.c
@@ -726,6 +726,11 @@ static void update_curr(struct cfs_rq *cfs_rq)
         account_cfs_rq_runtime(cfs_rq, delta_exec);
  }
  
+static void update_curr_fair(struct rq *rq)
+{
+       update_curr(cfs_rq_of(&rq->curr->se));
+}
+
  static inline void
  update_stats_wait_start(struct cfs_rq *cfs_rq, struct sched_entity *se)
  {
@@ -7956,6 +7961,8 @@ const struct sched_class fair_sched_class = {
  
         .get_rr_interval        = get_rr_interval_fair,
  
+       .update_curr            = update_curr_fair,
+
  #ifdef CONFIG_FAIR_GROUP_SCHED
         .task_move_group        = task_move_group_fair,
  #endif
diff --git a/kernel/sched/rt.c b/kernel/sched/rt.c

index d024e6ce30baf50037eac7c256dacc5bf27856f4..20bca398084ae770b36945e9aef238d954a6796e 100644 (file)
--- a/kernel/sched/rt.c
+++ b/kernel/sched/rt.c
@@ -2128,6 +2128,8 @@ const struct sched_class rt_sched_class = {
  
         .prio_changed           = prio_changed_rt,
         .switched_to            = switched_to_rt,
+
+       .update_curr            = update_curr_rt,
  };
  
  #ifdef CONFIG_SCHED_DEBUG
diff --git a/kernel/sched/sched.h b/kernel/sched/sched.h

index 24156c8434d1ebbe679a3fa6df45725aa7db3647..2df8ef067cc54ddd7a25c0b1cf45267214a2c31c 100644 (file)
--- a/kernel/sched/sched.h
+++ b/kernel/sched/sched.h
@@ -1135,6 +1135,8 @@ struct sched_class {
         unsigned int (*get_rr_interval) (struct rq *rq,
                                          struct task_struct *task);
  
+       void (*update_curr) (struct rq *rq);
+
  #ifdef CONFIG_FAIR_GROUP_SCHED
         void (*task_move_group) (struct task_struct *p, int on_rq);
  #endif
author	Stanislaw Gruszka <sgruszka@redhat.com>
	Wed, 12 Nov 2014 15:58:44 +0000 (16:58 +0100)
committer	Ingo Molnar <mingo@kernel.org>
	Sun, 16 Nov 2014 09:04:20 +0000 (10:04 +0100)
kernel/sched/core.c		patch \| blob \| blame \| history
kernel/sched/deadline.c		patch \| blob \| blame \| history
kernel/sched/fair.c		patch \| blob \| blame \| history
kernel/sched/rt.c		patch \| blob \| blame \| history
kernel/sched/sched.h		patch \| blob \| blame \| history