UBUNTU: Ubuntu-snapdragon-4.4.0-1028.31

[mirror_ubuntu-zesty-kernel.git] / kernel / cgroup.c
diff --git a/kernel/cgroup.c b/kernel/cgroup.c

index 9510da916fa3fd5d654a0e83f828a76c3f3c5086..df11deded5e2218f7ec43db8a91fec55acd4d6a1 100644 (file)
--- a/kernel/cgroup.c
+++ b/kernel/cgroup.c
@@ -57,7 +57,7 @@
  #include <linux/vmalloc.h> /* TODO: replace with more sophisticated array */
  #include <linux/kthread.h>
  #include <linux/delay.h>
-
+#include <linux/cpuset.h>
  #include <linux/atomic.h>
  #include <linux/cpuset.h>
  #include <linux/nsproxy.h>
@@ -249,6 +249,9 @@ static int cgroup_addrm_files(struct cgroup_subsys_state *css,
   */
  static bool cgroup_ssid_enabled(int ssid)
  {
+       if (CGROUP_SUBSYS_COUNT == 0)
+               return false;
+
         return static_key_enabled(cgroup_subsys_enabled_key[ssid]);
  }
  
@@ -1172,6 +1175,41 @@ static void cgroup_destroy_root(struct cgroup_root *root)
         cgroup_free_root(root);
  }
  
+/*
+ * look up cgroup associated with current task's cgroup namespace on the
+ * specified hierarchy
+ */
+static struct cgroup *
+current_cgns_cgroup_from_root(struct cgroup_root *root)
+{
+       struct cgroup *res = NULL;
+       struct css_set *cset;
+
+       lockdep_assert_held(&css_set_lock);
+
+       rcu_read_lock();
+
+       cset = current->nsproxy->cgroup_ns->root_cset;
+       if (cset == &init_css_set) {
+               res = &root->cgrp;
+       } else {
+               struct cgrp_cset_link *link;
+
+               list_for_each_entry(link, &cset->cgrp_links, cgrp_link) {
+                       struct cgroup *c = link->cgrp;
+
+                       if (c->root == root) {
+                               res = c;
+                               break;
+                       }
+               }
+       }
+       rcu_read_unlock();
+
+       BUG_ON(!res);
+       return res;
+}
+
  /* look up cgroup associated with given css_set on the specified hierarchy */
  static struct cgroup *cset_cgroup_from_root(struct css_set *cset,
                                             struct cgroup_root *root)
@@ -1589,6 +1627,33 @@ static int rebind_subsystems(struct cgroup_root *dst_root,
         return 0;
  }
  
+static int cgroup_show_path(struct seq_file *sf, struct kernfs_node *kf_node,
+                           struct kernfs_root *kf_root)
+{
+       int len = 0;
+       char *buf = NULL;
+       struct cgroup_root *kf_cgroot = cgroup_root_from_kf(kf_root);
+       struct cgroup *ns_cgroup;
+
+       buf = kmalloc(PATH_MAX, GFP_KERNEL);
+       if (!buf)
+               return -ENOMEM;
+
+       spin_lock_bh(&css_set_lock);
+       ns_cgroup = current_cgns_cgroup_from_root(kf_cgroot);
+       len = kernfs_path_from_node(kf_node, ns_cgroup->kn, buf, PATH_MAX);
+       spin_unlock_bh(&css_set_lock);
+
+       if (len >= PATH_MAX)
+               len = -ERANGE;
+       else if (len > 0) {
+               seq_escape(sf, buf, " \t\n\\");
+               len = 0;
+       }
+       kfree(buf);
+       return len;
+}
+
  static int cgroup_show_options(struct seq_file *seq,
                                struct kernfs_root *kf_root)
  {
@@ -2588,6 +2653,14 @@ static void cgroup_migrate_add_src(struct css_set *src_cset,
         lockdep_assert_held(&cgroup_mutex);
         lockdep_assert_held(&css_set_lock);
  
+       /*
+        * If ->dead, @src_set is associated with one or more dead cgroups
+        * and doesn't contain any migratable tasks.  Ignore it early so
+        * that the rest of migration path doesn't get confused by it.
+        */
+       if (src_cset->dead)
+               return;
+
         src_cgrp = cset_cgroup_from_root(src_cset, dst_cgrp->root);
  
         if (!list_empty(&src_cset->mg_preload_node))
@@ -2803,9 +2876,10 @@ static ssize_t __cgroup_procs_write(struct kernfs_open_file *of, char *buf,
                                     size_t nbytes, loff_t off, bool threadgroup)
  {
         struct task_struct *tsk;
+       struct cgroup_subsys *ss;
         struct cgroup *cgrp;
         pid_t pid;
-       int ret;
+       int ssid, ret;
  
         if (kstrtoint(strstrip(buf), 0, &pid) || pid < 0)
                 return -EINVAL;
@@ -2830,11 +2904,12 @@ static ssize_t __cgroup_procs_write(struct kernfs_open_file *of, char *buf,
                 tsk = tsk->group_leader;
  
         /*
-        * Workqueue threads may acquire PF_NO_SETAFFINITY and become
-        * trapped in a cpuset, or RT worker may be born in a cgroup
-        * with no rt_runtime allocated.  Just say no.
+        * kthreads may acquire PF_NO_SETAFFINITY during initialization.
+        * If userland migrates such a kthread to a non-root cgroup, it can
+        * become trapped in a cpuset, or RT kthread may be born in a
+        * cgroup with no rt_runtime allocated.  Just say no.
          */
-       if (tsk == kthreadd_task || (tsk->flags & PF_NO_SETAFFINITY)) {
+       if (tsk->no_cgroup_migration || (tsk->flags & PF_NO_SETAFFINITY)) {
                 ret = -EINVAL;
                 goto out_unlock_rcu;
         }
@@ -2853,6 +2928,9 @@ out_unlock_rcu:
         rcu_read_unlock();
  out_unlock_threadgroup:
         percpu_up_write(&cgroup_threadgroup_rwsem);
+       for_each_subsys(ss, ssid)
+               if (ss->post_attach)
+                       ss->post_attach();
         cgroup_kn_unlock(of->kn);
         return ret ?: nbytes;
  }
@@ -4770,14 +4848,15 @@ static void css_free_work_fn(struct work_struct *work)
  
         if (ss) {
                 /* css free path */
+               struct cgroup_subsys_state *parent = css->parent;
                 int id = css->id;
  
-               if (css->parent)
-                       css_put(css->parent);
-
                 ss->css_free(css);
                 cgroup_idr_remove(&ss->css_idr, id);
                 cgroup_put(cgrp);
+
+               if (parent)
+                       css_put(parent);
         } else {
                 /* cgroup free path */
                 atomic_dec(&cgrp->root->nr_cgrps);
@@ -4870,9 +4949,11 @@ static void init_and_link_css(struct cgroup_subsys_state *css,
         memset(css, 0, sizeof(*css));
         css->cgroup = cgrp;
         css->ss = ss;
+       css->id = -1;
         INIT_LIST_HEAD(&css->sibling);
         INIT_LIST_HEAD(&css->children);
         css->serial_nr = css_serial_nr_next++;
+       atomic_set(&css->online_cnt, 0);
  
         if (cgroup_parent(cgrp)) {
                 css->parent = cgroup_css(cgroup_parent(cgrp), ss);
@@ -4895,6 +4976,10 @@ static int online_css(struct cgroup_subsys_state *css)
         if (!ret) {
                 css->flags |= CSS_ONLINE;
                 rcu_assign_pointer(css->cgroup->subsys[ss->id], css);
+
+               atomic_inc(&css->online_cnt);
+               if (css->parent)
+                       atomic_inc(&css->parent->online_cnt);
         }
         return ret;
  }
@@ -5126,10 +5211,15 @@ static void css_killed_work_fn(struct work_struct *work)
                 container_of(work, struct cgroup_subsys_state, destroy_work);
  
         mutex_lock(&cgroup_mutex);
-       offline_css(css);
-       mutex_unlock(&cgroup_mutex);
  
-       css_put(css);
+       do {
+               offline_css(css);
+               css_put(css);
+               /* @css can't go away while we're holding cgroup_mutex */
+               css = css->parent;
+       } while (css && atomic_dec_and_test(&css->online_cnt));
+
+       mutex_unlock(&cgroup_mutex);
  }
  
  /* css kill confirmation processing requires process context, bounce */
@@ -5138,8 +5228,10 @@ static void css_killed_ref_fn(struct percpu_ref *ref)
         struct cgroup_subsys_state *css =
                 container_of(ref, struct cgroup_subsys_state, refcnt);
  
-       INIT_WORK(&css->destroy_work, css_killed_work_fn);
-       queue_work(cgroup_destroy_wq, &css->destroy_work);
+       if (atomic_dec_and_test(&css->online_cnt)) {
+               INIT_WORK(&css->destroy_work, css_killed_work_fn);
+               queue_work(cgroup_destroy_wq, &css->destroy_work);
+       }
  }
  
  /**
@@ -5208,6 +5300,7 @@ static int cgroup_destroy_locked(struct cgroup *cgrp)
         __releases(&cgroup_mutex) __acquires(&cgroup_mutex)
  {
         struct cgroup_subsys_state *css;
+       struct cgrp_cset_link *link;
         int ssid;
  
         lockdep_assert_held(&cgroup_mutex);
@@ -5228,11 +5321,18 @@ static int cgroup_destroy_locked(struct cgroup *cgrp)
                 return -EBUSY;
  
         /*
-        * Mark @cgrp dead.  This prevents further task migration and child
-        * creation by disabling cgroup_lock_live_group().
+        * Mark @cgrp and the associated csets dead.  The former prevents
+        * further task migration and child creation by disabling
+        * cgroup_lock_live_group().  The latter makes the csets ignored by
+        * the migration path.
          */
         cgrp->self.flags &= ~CSS_ONLINE;
  
+       spin_lock_bh(&css_set_lock);
+       list_for_each_entry(link, &cgrp->cset_links, cset_link)
+               link->cset->dead = true;
+       spin_unlock_bh(&css_set_lock);
+
         /* initiate massacre of all css's */
         for_each_css(css, ssid, cgrp)
                 kill_css(css);
@@ -5272,6 +5372,7 @@ static struct kernfs_syscall_ops cgroup_kf_syscall_ops = {
         .mkdir                  = cgroup_mkdir,
         .rmdir                  = cgroup_rmdir,
         .rename                 = cgroup_rename,
+       .show_path              = cgroup_show_path,
  };
  
  static void __init cgroup_init_subsys(struct cgroup_subsys *ss, bool early)
@@ -5951,9 +6052,8 @@ struct cgroup_namespace *
  copy_cgroup_ns(unsigned long flags, struct user_namespace *user_ns,
                struct cgroup_namespace *old_ns)
  {
-       struct cgroup_namespace *new_ns = NULL;
-       struct css_set *cset = NULL;
-       int err;
+       struct cgroup_namespace *new_ns;
+       struct css_set *cset;
  
         BUG_ON(!old_ns);
  
@@ -5963,9 +6063,8 @@ copy_cgroup_ns(unsigned long flags, struct user_namespace *user_ns,
         }
  
         /* Allow only sysadmin to create cgroup namespace. */
-       err = -EPERM;
         if (!ns_capable(user_ns, CAP_SYS_ADMIN))
-               goto err_out;
+               return ERR_PTR(-EPERM);
  
         mutex_lock(&cgroup_mutex);
         spin_lock_bh(&css_set_lock);
@@ -5976,21 +6075,16 @@ copy_cgroup_ns(unsigned long flags, struct user_namespace *user_ns,
         spin_unlock_bh(&css_set_lock);
         mutex_unlock(&cgroup_mutex);
  
-       err = -ENOMEM;
         new_ns = alloc_cgroup_ns();
-       if (!new_ns)
-               goto err_out;
+       if (IS_ERR(new_ns)) {
+               put_css_set(cset);
+               return new_ns;
+       }
  
         new_ns->user_ns = get_user_ns(user_ns);
         new_ns->root_cset = cset;
  
         return new_ns;
-
-err_out:
-       if (cset)
-               put_css_set(cset);
-       kfree(new_ns);
-       return ERR_PTR(err);
  }
  
  static inline struct cgroup_namespace *to_cg_ns(struct ns_common *ns)