]> git.proxmox.com Git - mirror_lxc.git/blobdiff - src/lxc/monitor.c
commands: add lxc_cmd_state_server()
[mirror_lxc.git] / src / lxc / monitor.c
index e108eb764b3d7c56761c312d454623a4be30a228..1758402a9dd0f07b3bc83f99c6b38d3a726ae71d 100644 (file)
  *
  * You should have received a copy of the GNU Lesser General Public
  * License along with this library; if not, write to the Free Software
- * Foundation, Inc., 59 Temple Place, Suite 330, Boston, MA 02111-1307 USA
+ * Foundation, Inc., 51 Franklin Street, Fifth Floor, Boston, MA 02110-1301 USA
  */
 
-#include <stdio.h>
 #include <errno.h>
-#include <unistd.h>
-#include <string.h>
-#include <stdlib.h>
 #include <fcntl.h>
-#include <sys/types.h>
-#include <sys/stat.h>
+#include <inttypes.h>
+#include <poll.h>
+#include <stddef.h>
+#include <stdint.h>
+#include <stdio.h>
+#include <stdlib.h>
+#include <string.h>
+#include <unistd.h>
+#include <net/if.h>
+#include <netinet/in.h>
 #include <sys/param.h>
 #include <sys/socket.h>
+#include <sys/stat.h>
+#include <sys/types.h>
 #include <sys/wait.h>
-#include <netinet/in.h>
-#include <net/if.h>
 
-#include "error.h"
+#include "config.h"
 #include "af_unix.h"
-
-#include <lxc/log.h>
-#include <lxc/state.h>
-#include <lxc/monitor.h>
-#include <lxc/utils.h>
+#include "error.h"
+#include "log.h"
+#include "lxclock.h"
+#include "monitor.h"
+#include "state.h"
+#include "utils.h"
 
 lxc_log_define(lxc_monitor, lxc);
 
 /* routines used by monitor publishers (containers) */
+int lxc_monitor_fifo_name(const char *lxcpath, char *fifo_path, size_t fifo_path_sz,
+                         int do_mkdirp)
+{
+       int ret;
+       char *rundir;
+
+       rundir = get_rundir();
+       if (!rundir)
+               return -1;
+
+       if (do_mkdirp) {
+               ret = snprintf(fifo_path, fifo_path_sz, "%s/lxc/%s", rundir, lxcpath);
+               if (ret < 0 || (size_t)ret >= fifo_path_sz) {
+                       ERROR("rundir/lxcpath (%s/%s) too long for monitor fifo.", rundir, lxcpath);
+                       free(rundir);
+                       return -1;
+               }
+               ret = mkdir_p(fifo_path, 0755);
+               if (ret < 0) {
+                       ERROR("Unable to create monitor fifo directory %s.", fifo_path);
+                       free(rundir);
+                       return ret;
+               }
+       }
+       ret = snprintf(fifo_path, fifo_path_sz, "%s/lxc/%s/monitor-fifo", rundir, lxcpath);
+       if (ret < 0 || (size_t)ret >= fifo_path_sz) {
+               ERROR("rundir/lxcpath (%s/%s) too long for monitor fifo.", rundir, lxcpath);
+               free(rundir);
+               return -1;
+       }
+       free(rundir);
+       return 0;
+}
+
 static void lxc_monitor_fifo_send(struct lxc_msg *msg, const char *lxcpath)
 {
        int fd,ret;
        char fifo_path[PATH_MAX];
 
        BUILD_BUG_ON(sizeof(*msg) > PIPE_BUF); /* write not guaranteed atomic */
-       ret = snprintf(fifo_path, sizeof(fifo_path), "%s/monitor-fifo", lxcpath);
-       if (ret < 0 || ret >= sizeof(fifo_path)) {
-               ERROR("lxcpath too long to open monitor fifo");
+
+       ret = lxc_monitor_fifo_name(lxcpath, fifo_path, sizeof(fifo_path), 0);
+       if (ret < 0)
                return;
-       }
 
-       fd = open(fifo_path, O_WRONLY);
+       /* Open the fifo nonblock in case the monitor is dead, we don't want the
+        * open to wait for a reader since it may never come.
+        */
+       fd = open(fifo_path, O_WRONLY | O_NONBLOCK);
        if (fd < 0) {
-               /* it is normal for this open to fail when there is no monitor
-                * running, so we don't log it
+               /* It is normal for this open() to fail with ENXIO when there is
+                * no monitor running, so we don't log it.
                 */
+               if (errno == ENXIO)
+                       return;
+
+               WARN("Failed to open fifo to send message: %s.", strerror(errno));
+               return;
+       }
+
+       if (fcntl(fd, F_SETFL, O_WRONLY) < 0) {
+               close(fd);
                return;
        }
 
        ret = write(fd, msg, sizeof(*msg));
        if (ret != sizeof(*msg)) {
-               SYSERROR("failed to write monitor fifo %s", fifo_path);
+               close(fd);
+               SYSERROR("Failed to write to monitor fifo \"%s\".", fifo_path);
                return;
        }
 
        close(fd);
 }
 
-void lxc_monitor_send_state(const char *name, lxc_state_t state, const char *lxcpath)
+void lxc_monitor_send_state(const char *name, lxc_state_t state,
+                           const char *lxcpath)
 {
-       struct lxc_msg msg = { .type = lxc_msg_state,
-                              .value = state };
+       struct lxc_msg msg = {.type = lxc_msg_state, .value = state};
        strncpy(msg.name, name, sizeof(msg.name));
        msg.name[sizeof(msg.name) - 1] = 0;
 
        lxc_monitor_fifo_send(&msg, lxcpath);
 }
 
+void lxc_monitor_send_exit_code(const char *name, int exit_code,
+                               const char *lxcpath)
+{
+       struct lxc_msg msg = {.type = lxc_msg_exit_code, .value = exit_code};
+       strncpy(msg.name, name, sizeof(msg.name));
+       msg.name[sizeof(msg.name) - 1] = 0;
+
+       lxc_monitor_fifo_send(&msg, lxcpath);
+}
 
 /* routines used by monitor subscribers (lxc-monitor) */
 int lxc_monitor_close(int fd)
@@ -93,86 +153,146 @@ int lxc_monitor_close(int fd)
        return close(fd);
 }
 
+/* Enforces \0-termination for the abstract unix socket. This is not required
+ * but allows us to print it out.
+ *
+ * Older version of liblxc only allowed for 105 bytes to be used for the
+ * abstract unix domain socket name because the code for our abstract unix
+ * socket handling performed invalid checks. Since we \0-terminate we could now
+ * have a maximum of 106 chars. But to not break backwards compatibility we keep
+ * the limit at 105.
+ */
 int lxc_monitor_sock_name(const char *lxcpath, struct sockaddr_un *addr) {
        size_t len;
        int ret;
-       char *sockname = &addr->sun_path[0]; // 1 for abstract
+       char *path;
+       uint64_t hash;
 
-       /* addr.sun_path is only 108 bytes.
-        * should we take a hash of lxcpath? a subset of it? ftok()? we need
-        * to make sure it is unique.
+       /* addr.sun_path is only 108 bytes, so we hash the full name and
+        * then append as much of the name as we can fit.
         */
        memset(addr, 0, sizeof(*addr));
        addr->sun_family = AF_UNIX;
+
+       /* strlen("lxc/") + strlen("/monitor-sock") + 1 = 18 */
+       len = strlen(lxcpath) + 18;
+       path = alloca(len);
+       ret = snprintf(path, len, "lxc/%s/monitor-sock", lxcpath);
+       if (ret < 0 || (size_t)ret >= len) {
+               ERROR("failed to create name for monitor socket");
+               return -1;
+       }
+
+       /* Note: snprintf() will \0-terminate addr->sun_path on the 106th byte
+        * and so the abstract socket name has 105 "meaningful" characters. This
+        * is absolutely intentional. For further info read the comment for this
+        * function above!
+        */
        len = sizeof(addr->sun_path) - 1;
-       ret = snprintf(sockname, len, "%s/monitor-sock", lxcpath);
-       if (ret < 0 || ret >= len) {
-               ERROR("lxcpath too long for unix socket");
+       hash = fnv_64a_buf(path, ret, FNV1A_64_INIT);
+       ret = snprintf(addr->sun_path, len, "@lxc/%016" PRIx64 "/%s", hash, lxcpath);
+       if (ret < 0) {
+               ERROR("failed to create hashed name for monitor socket");
                return -1;
        }
+
+       /* replace @ with \0 */
+       addr->sun_path[0] = '\0';
+       INFO("using monitor socket name \"%s\" (length of socket name %zu must be <= %zu)", &addr->sun_path[1], strlen(&addr->sun_path[1]), sizeof(addr->sun_path) - 3);
+
        return 0;
 }
 
 int lxc_monitor_open(const char *lxcpath)
 {
        struct sockaddr_un addr;
-       int fd,ret;
-       int retry,backoff_ms[] = {10, 50, 100};
+       int fd;
+       size_t retry;
+       size_t len;
+       int ret = -1;
+       int backoff_ms[] = {10, 50, 100};
 
        if (lxc_monitor_sock_name(lxcpath, &addr) < 0)
                return -1;
 
        fd = socket(PF_UNIX, SOCK_STREAM, 0);
        if (fd < 0) {
-               ERROR("socket : %s", strerror(errno));
-               return -1;
+               ERROR("Failed to create socket: %s.", strerror(errno));
+               return -errno;
+       }
+
+       len = strlen(&addr.sun_path[1]);
+       DEBUG("opening monitor socket %s with len %zu", &addr.sun_path[1], len);
+       if (len >= sizeof(addr.sun_path) - 1) {
+               errno = ENAMETOOLONG;
+               ret = -errno;
+               ERROR("name of monitor socket too long (%zu bytes): %s", len, strerror(errno));
+               goto on_error;
        }
 
-       for (retry = 0; retry < sizeof(backoff_ms)/sizeof(backoff_ms[0]); retry++) {
-               ret = connect(fd, (struct sockaddr *)&addr, sizeof(addr));
-               if (ret == 0 || errno != ECONNREFUSED)
+       for (retry = 0; retry < sizeof(backoff_ms) / sizeof(backoff_ms[0]); retry++) {
+               fd = lxc_abstract_unix_connect(addr.sun_path);
+               if (fd < 0 || errno != ECONNREFUSED)
                        break;
-               ERROR("connect : backing off %d", backoff_ms[retry]);
+               ERROR("Failed to connect to monitor socket. Retrying in %d ms: %s", backoff_ms[retry], strerror(errno));
                usleep(backoff_ms[retry] * 1000);
        }
 
-       if (ret < 0) {
-               ERROR("connect : %s", strerror(errno));
-               goto err1;
+       if (fd < 0) {
+               ret = -errno;
+               ERROR("Failed to connect to monitor socket: %s.", strerror(errno));
+               goto on_error;
        }
+       ret = 0;
+
        return fd;
-err1:
+
+on_error:
        close(fd);
        return ret;
 }
 
-int lxc_monitor_read_timeout(int fd, struct lxc_msg *msglxc, int timeout)
+int lxc_monitor_read_fdset(struct pollfd *fds, nfds_t nfds, struct lxc_msg *msg,
+                          int timeout)
 {
-       fd_set rfds;
-       struct timeval tv;
+       long i;
        int ret;
 
-       if (timeout != -1) {
-               FD_ZERO(&rfds);
-               FD_SET(fd, &rfds);
-
-               tv.tv_sec = timeout;
-               tv.tv_usec = 0;
+       ret = poll(fds, nfds, timeout * 1000);
+       if (ret == -1)
+               return -1;
+       else if (ret == 0)
+               return -2;  // timed out
 
-               ret = select(fd+1, &rfds, NULL, NULL, &tv);
-               if (ret == -1)
-                       return -1;
-               else if (!ret)
-                       return -2;  // timed out
+       /* Only read from the first ready fd, the others will remain ready for
+        * when this routine is called again.
+        */
+       for (i = 0; i < nfds; i++) {
+               if (fds[i].revents != 0) {
+                       fds[i].revents = 0;
+                       ret = recv(fds[i].fd, msg, sizeof(*msg), 0);
+                       if (ret <= 0) {
+                               SYSERROR("Failed to receive message. Did monitord die?: %s.", strerror(errno));
+                               return -1;
+                       }
+                       return ret;
+               }
        }
 
-       ret = recv(fd, msglxc, sizeof(*msglxc), 0);
-       if (ret <= 0) {
-               SYSERROR("client failed to recv (monitord died?) %s",
-                        strerror(errno));
-               return -1;
-       }
-       return ret;
+       SYSERROR("No ready fd found.");
+
+       return -1;
+}
+
+int lxc_monitor_read_timeout(int fd, struct lxc_msg *msg, int timeout)
+{
+       struct pollfd fds;
+
+       fds.fd = fd;
+       fds.events = POLLIN | POLLPRI;
+       fds.revents = 0;
+
+       return lxc_monitor_read_fdset(&fds, 1, msg, timeout);
 }
 
 int lxc_monitor_read(int fd, struct lxc_msg *msg)
@@ -180,73 +300,94 @@ int lxc_monitor_read(int fd, struct lxc_msg *msg)
        return lxc_monitor_read_timeout(fd, msg, -1);
 }
 
+#define LXC_MONITORD_PATH LIBEXECDIR "/lxc/lxc-monitord"
 
-
-/* used to spawn a monitord either on startup of a daemon container, or when
- * lxc-monitor starts
+/* Used to spawn a monitord either on startup of a daemon container, or when
+ * lxc-monitor starts.
  */
 int lxc_monitord_spawn(const char *lxcpath)
 {
-       pid_t pid1,pid2;
+       int ret;
        int pipefd[2];
-       char pipefd_str[11];
-
-       char * const args[] = {
-               "/usr/bin/lxc-monitord",
-               (char *)lxcpath,
-               pipefd_str,
-               NULL,
+       char pipefd_str[LXC_NUMSTRLEN64];
+       pid_t pid1, pid2;
+
+       char *const args[] = {
+           LXC_MONITORD_PATH,
+           (char *)lxcpath,
+           pipefd_str,
+           NULL,
        };
 
        /* double fork to avoid zombies when monitord exits */
        pid1 = fork();
        if (pid1 < 0) {
-               SYSERROR("failed to fork");
+               SYSERROR("Failed to fork().");
                return -1;
        }
 
        if (pid1) {
-               waitpid(pid1, NULL, 0);
+               DEBUG("Going to wait for pid %d.", pid1);
+               if (waitpid(pid1, NULL, 0) != pid1)
+                       return -1;
+               DEBUG("Finished waiting on pid %d.", pid1);
                return 0;
        }
 
        if (pipe(pipefd) < 0) {
-               SYSERROR("failed to create pipe");
+               SYSERROR("Failed to create pipe.");
                exit(EXIT_FAILURE);
        }
 
        pid2 = fork();
        if (pid2 < 0) {
-               SYSERROR("failed to fork");
+               SYSERROR("Failed to fork().");
                exit(EXIT_FAILURE);
        }
+
        if (pid2) {
+               DEBUG("Trying to sync with child process.");
                char c;
-               /* wait for daemon to create socket */
+               /* Wait for daemon to create socket. */
                close(pipefd[1]);
-               /* sync with child, we're ignoring the return from read
+
+               /* Sync with child, we're ignoring the return from read
                 * because regardless if it works or not, either way we've
                 * synced with the child process. the if-empty-statement
                 * construct is to quiet the warn-unused-result warning.
                 */
-               if (read(pipefd[0], &c, 1)) ;
+               if (read(pipefd[0], &c, 1))
+                       ;
+
                close(pipefd[0]);
+
+               DEBUG("Successfully synced with child process.");
                exit(EXIT_SUCCESS);
        }
 
-       umask(0);
        if (setsid() < 0) {
-               SYSERROR("failed to setsid");
+               SYSERROR("Failed to setsid().");
+               exit(EXIT_FAILURE);
+       }
+
+       lxc_check_inherited(NULL, true, pipefd[1]);
+       if (null_stdfds() < 0) {
+               SYSERROR("Failed to dup2() standard file descriptors to /dev/null.");
                exit(EXIT_FAILURE);
        }
-       close(0);
-       close(1);
-       close(2);
-       open("/dev/null", O_RDONLY);
-       open("/dev/null", O_RDWR);
-       open("/dev/null", O_RDWR);
+
        close(pipefd[0]);
-       sprintf(pipefd_str, "%d", pipefd[1]);
+
+       ret = snprintf(pipefd_str, LXC_NUMSTRLEN64, "%d", pipefd[1]);
+       if (ret < 0 || ret >= LXC_NUMSTRLEN64) {
+               ERROR("Failed to create pid argument to pass to monitord.");
+               exit(EXIT_FAILURE);
+       }
+
+       DEBUG("Using pipe file descriptor %d for monitord.", pipefd[1]);
+
        execvp(args[0], args);
+       SYSERROR("failed to exec lxc-monitord");
+
        exit(EXIT_FAILURE);
 }