1.2 Linux中的进程 --- fork、vfork、exec函数族、进程退出方式、守护进程等分析

fork和vfork分析：

　　在fork还没有实现copy on write之前，Unix设计者很关心fork之后立即执行exec所造成的地址空间浪费，也就是拷贝进程地址空间时的效率问题，所以引入vfork系统调用。

　　vfork有个限制，子进程必须立刻执行_exit或者exec函数。

　　即使fork实现了copy on write，效率也没有vfork高，但是现在已经不推荐使用vfork了，因为几乎每一个vfork的实现，都或多或少存在一定的问题。

fork：子进程拷贝父进程的数据段；vfork：子进程与父进程共享数据段。

fork：父子进程的执行顺序不确定；vfork：子进程先运行，父进程后运行。

vfork函数的目的就是创建一个子进程，然后把一个应用给加载起来，相当于用一个应用去替换这个子进程（替换代码段、数据段、堆栈段，修改进程控制块），vfork之后，如果子进程不立即拉起一个应用，而是执行其他操作，则很可能修改了和父进程共享的数据，造成不稳定现象。

　　下面看一个vfork的例子：

 1 #include <sys/types.h>
 2 #include <unistd.h>
 3 
 4 #include <stdlib.h>
 5 #include <stdio.h>
 6 #include <string.h>
 7 
 8 #include <signal.h>
 9 #include <errno.h>
10 
11 #include <sys/stat.h>
12 #include <fcntl.h>
13 
14 
15 int main(void)
16 {
17     pid_t pid;
18     int fd = 0;
19     int abc = 10;
20     
21     printf("before fork pid : %d \n", getpid());
22     
23     pid = vfork();
24     
25     if(-1 == pid)
26     {
27         perror("pid < 0 ");
28         return -1;
29     }
30     if(pid > 0)
31     {
32         printf("parent : pid : %d \n", getpid());
33     }
34     
35     if(0 == pid)
36     {
37         printf("child : %d, parent : %d\n", getpid(), getppid());
38         printf("abc : %d\n", abc);
39     }
40     
41     printf("after ...\n");
42     return 0;
43 }

上面的程序中，vfork生成的子进程没有立即执行exit或者exec，而是做了两个打印操作，运行结果如下：

1.2 Linux中的进程 --- fork、vfork、exec函数族、进程退出方式、守护进程等分析

我们在第38行访问了数据段中的abc变量，程序进入了死循环，产生了不稳定现象。我们在第38行程序的下一行加上一句exit(0)，运行结果如下：

1.2 Linux中的进程 --- fork、vfork、exec函数族、进程退出方式、守护进程等分析

这次运行就正常了。

　　vfork主要用来拉起一个应用，我们创建一个文件hello.c，并写上如下程序：

1 #include <stdio.h>
2 
3 int main()
4 {
5     printf("Hello World!\n");
6     return 0;
7 }

　　我们使用execve系统调用来拉起一个应用，修改vfork测试程序如下：

 1 #include <sys/types.h>
 2 #include <unistd.h>
 3 
 4 #include <stdlib.h>
 5 #include <stdio.h>
 6 #include <string.h>
 7 
 8 #include <signal.h>
 9 #include <errno.h>
10 
11 #include <sys/stat.h>
12 #include <fcntl.h>
13 
14 
15 int main(void)
16 {
17     pid_t pid;
18     int fd = 0;
19     int ret = 0;
20     
21     printf("before fork pid : %d \n", getpid());
22     
23     pid = vfork();
24     
25     if(-1 == pid)
26     {
27         perror("pid < 0 ");
28         return -1;
29     }
30     if(pid > 0)
31     {
32         printf("parent : pid : %d \n", getpid());
33     }
34     
35     if(0 == pid)
36     {
37         printf("child : %d, parent : %d\n", getpid(), getppid());
38         ret = execve("./hello", NULL, NULL);
39         
40         if(ret == -1)
41         {
42             perror("execve");
43             exit(-1);
44         }
45         
46         printf("execve execut failed\n");
47         
48         exit(0);
49     }
50     
51     printf("after ...\n");
52     return 0;
53 }

　　执行结果如下:

1.2 Linux中的进程 --- fork、vfork、exec函数族、进程退出方式、守护进程等分析

由此可以看出，hello这个应用被成功拉起来了，子进程的整个进程空间被hello替换掉，因此后面的printf("execve execut failed\n")便不会再执行。

　　修改程序，拉起一个ls应用，如下所示：

 1 #include <sys/types.h>
 2 #include <unistd.h>
 3 
 4 #include <stdlib.h>
 5 #include <stdio.h>
 6 #include <string.h>
 7 
 8 #include <signal.h>
 9 #include <errno.h>
10 
11 #include <sys/stat.h>
12 #include <fcntl.h>
13 
14 
15 int main(void)
16 {
17     pid_t pid;
18     int fd = 0;
19     int ret = 0;
20     char * const argv[] = {"ls", "-l", NULL};
21     
22     printf("before fork pid : %d \n", getpid());
23     
24     pid = vfork();
25     
26     if(-1 == pid)
27     {
28         perror("pid < 0 ");
29         return -1;
30     }
31     if(pid > 0)
32     {
33         printf("parent : pid : %d \n", getpid());
34     }
35     
36     if(0 == pid)
37     {
38         printf("child : %d, parent : %d\n", getpid(), getppid());
39         ret = execve("/bin/ls", argv, NULL);
40         
41         if(ret == -1)
42         {
43             perror("execve");
44             exit(-1);
45         }
46         
47         printf("execve execut failed\n");
48         
49         exit(0);
50     }
51 
52     return 0;
53 }

执行结果如下：

1.2 Linux中的进程 --- fork、vfork、exec函数族、进程退出方式、守护进程等分析

　　从结果看出execve成功拉起了ls应用。

进程终止的5种方式：

进程终止有5种方式，分别为：

正常退出：

　　从main函数返回

　　调用exit

　　调用_exit

异常退出：

　　调用abort，产生SIGABOUT信号

　　由信号终止，ctrl+c SIGINT

其中exit和_exit的区别是：exit是c库函数，在退出之前会执行一些进程的清理工作，例如将用户空间缓冲区中的数据写到磁盘等，做完清理工作然后在调用_exit进入内核处理。_exit是系统调用，没有清理的过程，而是直接陷入内核去结束程序。二者的区别示意图如下：

1.2 Linux中的进程 --- fork、vfork、exec函数族、进程退出方式、守护进程等分析

下面演示这两个函数的区别，首先调用的是exit，程序如下：

1 #include <stdio.h>
2 #include <unistd.h>
3 #include <stdlib.h>
4 
5 int main()
6 {
7     printf("hello ... ");
8     exit(0);
9 }

执行结果如下：

1.2 Linux中的进程 --- fork、vfork、exec函数族、进程退出方式、守护进程等分析

将exit(0)替换为_exit(0)却什么都没有打印出来，现象分析：

　　printf输出语句向终端写数据时是行缓冲的，也即遇到‘\n’时就会将数据从应用空间缓冲区写入内核，如果没有遇到换行符，就先将数据存在应用空间的缓冲区中，exit在退出时会先将应用空间缓冲区中的数据写入到内核，然后再去内核执行真正的退出，而_exit直接进入内核，而应用空间缓冲区中的数据就相当于不要了，所以直接调用_exit时没有任何打印。

　　exit执行时还可以调用终止处理程序，这个程序时我们自己注册的，这个注册的api函数就是atexit，下面我们直接给出实验程序：

 1 #include <stdio.h>
 2 #include <unistd.h>
 3 #include <stdlib.h>
 4 
 5 void bye1()
 6 {
 7     printf("bye1 ... \n");
 8 }
 9 
10 int main()
11 {
12     atexit(bye1);
13     printf("hello ... \n");
14     exit(0);
15 }

执行结果如下，终止处理程序被调用了：

1.2 Linux中的进程 --- fork、vfork、exec函数族、进程退出方式、守护进程等分析

我们可以注册多个终止处理程序，而且先注册的后执行。

　　程序还可以调用abort异常退出，异常退出时，注册的终止处理程序不会被调用，演示程序如下：

 1 #include <stdio.h>
 2 #include <unistd.h>
 3 #include <stdlib.h>
 4 
 5 void bye1()
 6 {
 7     printf("bye1 ... \n");
 8 }
 9 
10 int main()
11 {
12     atexit(bye1);
13     printf("hello ... \n");
14     abort();
15     exit(0);
16 }

执行结果如下：

1.2 Linux中的进程 --- fork、vfork、exec函数族、进程退出方式、守护进程等分析

最后一种进程终止方式就是向进程发信号，如果是一个杀死进程的信号，那么进程就会消失，其他信号可以将睡眠（可中断睡眠）进程唤醒。

　　测试小程序如下：

 1 #include <stdio.h>
 2 #include <unistd.h>
 3 #include <stdlib.h>
 4 
 5 void bye1()
 6 {
 7     printf("bye1 ... \n");
 8 }
 9 
10 int main()
11 {
12     atexit(bye1);
13     printf("hello ... \n");
14     sleep(100);
15     printf("after ... \n");
16     return 0;;
17 }

　　程序注册了终止处理程序，退出前睡眠100秒，在睡眠期间我们在键盘上按下crtl+c，执行结果如下：

1.2 Linux中的进程 --- fork、vfork、exec函数族、进程退出方式、守护进程等分析

进程被终止，而且终止处理程序没有被调用。我们在键盘上按下的ctrl+c发出的是SIGINT信号，这个信号用来终止进程运行。

SIGINT、SIGTERM、SIGKILL三者都是结束/终止进程运行，区别如下：

1.SIGINT SIGTERM区别

前者与字符ctrl+c关联，后者没有任何控制字符关联。

前者只能结束前台进程，后者则不是。

2.SIGTERM SIGKILL的区别

前者可以被阻塞、处理和忽略，但是后者不可以。KILL命令的默认不带参数发送的信号就是SIGTERM.让程序有好的退出。因为它可以被阻塞，所以有的进程不能被结束时，用kill发送后者信号，即可。即：kill -9 进程号。

exec函数族：

　　在进程的创建上Unix采用了一种独特的方法，它将进程创建和加载一个新的进程映像相分离，这样做的好处是有更多的余地对两种操作进行管理。当我们创建了一个进程之后，通常将子进程替换成新的进程映像，这可以使用exec系列的函数来进行，当然exec系列的函数也可以将当前进程替换掉。

　　exec函数族中的函数如下：

　　int execl(const char *path, const char *arg, ...);
　　int execlp(const char *file, const char *arg, ...);
　　int execle(const char *path, const char *arg, ... , char * const envp[]);

　　int execv(const char *path, char *const argv[]);
　　int execvp(const char *file, char *const argv[]);

它们的关系如下：

1.2 Linux中的进程 --- fork、vfork、exec函数族、进程退出方式、守护进程等分析

只有execve是系统调用，其他几个只是库函数，是对execve的封装，前三个函数中的函数名字中 l 代表可变参数列表，p代表在PATH环境变量中搜索file文件，e代表环境变量。后面两个函数中v代表需要传入指针数组argv。以上函数中，带p的函数只需要传入文件名，不带p的函数需要传入路径名。

下面演示execlp的使用，程序如下：

 1 #include <sys/types.h>
 2 #include <unistd.h>
 3 
 4 #include <stdlib.h>
 5 #include <stdio.h>
 6 #include <string.h>
 7 
 8 #include <signal.h>
 9 #include <errno.h>
10 
11 #include <sys/stat.h>
12 #include <fcntl.h>
13 
14 
15 int main(void)
16 {
17     printf("before execlp \n");
18     execlp("ls", "ls", "-l", NULL);
19     
20     printf("after execlp \n");
21     return 0;
22 }

执行结果如下：

1.2 Linux中的进程 --- fork、vfork、exec函数族、进程退出方式、守护进程等分析

execlp是对execve系统调用的封装，简化了函数的使用，l代表是可变参数，p代表PATH环境变量，我们只需要给这个函数传入可执行文件名，系统会自动根据PATH变量的值搜索这个文件。

　　我们使用execlp拉起一个自己写的应用，如下：

1 #include <stdio.h>
2 
3 int main()
4 {
5     printf("app getpid() : %d\n", getpid());
6     return 0;
7 }

修改主控制函数：

 1 #include <sys/types.h>
 2 #include <unistd.h>
 3 
 4 #include <stdlib.h>
 5 #include <stdio.h>
 6 #include <string.h>
 7 
 8 #include <signal.h>
 9 #include <errno.h>
10 
11 #include <sys/stat.h>
12 #include <fcntl.h>
13 
14 
15 int main(void)
16 {
17     printf("getpid() : %d \n", getpid());
18     execlp("./execlp-getpid", NULL, NULL);
19     
20     return 0;
21 }

执行结果如下：

1.2 Linux中的进程 --- fork、vfork、exec函数族、进程退出方式、守护进程等分析

可见，原来的进程在拉起应用之后，进程pid是不变的。

　　接着对execle进行实验分析，下面演示一个环境变量相关的小程序，这个小程序是被主控制程序拉起来的应用，程序如下所示：

 1 #include <sys/types.h>
 2 #include <unistd.h>
 3 #include <stdio.h>
 4 #include <errno.h>
 5 
 6 extern char **environ;
 7 
 8 int main(void)
 9 {
10     int i = 0;
11     printf("before printf environ ... \n");
12     
13     for(i = 0; environ[i] != NULL; i++)
14     {
15         printf("%s\n", environ[i]);
16     }
17     
18     return 0;
19 }

这个小程序如果单独执行的话，它会打印系统中所有的环境变量，如下所示：

1.2 Linux中的进程 --- fork、vfork、exec函数族、进程退出方式、守护进程等分析

下面我们给出主控制程序，这个程序将上面的打印环境变量的应用拉起来，最主要的函数是execle，具体如下：

 1 #include <sys/types.h>
 2 #include <unistd.h>
 3 #include <stdio.h>
 4 
 5 #include <errno.h>
 6 
 7 
 8 int main(void)
 9 {
10     printf("getpid() : %d \n", getpid());
11     execle("./environ", NULL, NULL);
12     printf("after execle... \n");
13     return 0;
14 }

execle中传入环境变量的部分我们给的是NULL指针，执行结果如下：

1.2 Linux中的进程 --- fork、vfork、exec函数族、进程退出方式、守护进程等分析

可见，被拉起来的应用中的for循环没有得到执行，这跟我们传入的NULL指针是有关系的。

　　如果我们想在程序中定义自己的环境变量，并传给即将拉起来的应用程序，该怎么实现呢？修改主控制程序如下，打印环境变量的程序保持不变。

 1 #include <sys/types.h>
 2 #include <unistd.h>
 3 #include <stdio.h>
 4 
 5 #include <errno.h>
 6 
 7 
 8 int main(void)
 9 {
10     char * const argv[] = {"aaa=111", "bbb=222", NULL};
11     printf("getpid() : %d \n", getpid());
12     
13     execle("./environ", NULL, argv);
14     printf("after execle... \n");
15     return 0;
16 }

执行结果如下，打印出了我们自己定义的环境变量：

1.2 Linux中的进程 --- fork、vfork、exec函数族、进程退出方式、守护进程等分析

守护进程：

　　守护进程是在后台运行不受终端控制的进程，通常情况下守护进程在系统启动时自动运行。

　　守护进程的名称通常以d结尾，比如sshd、xinetd、crond等。

创建守护进程的步骤如下：

1、调用fork创建新进程，它会是将来的守护进程

2、在父进程中调用exit，保证子进程不是进程组组长

3、调用setsid创建新的会话期

4、将当前目录改为根目录（如果把当前目录作为守护进程的目录，当前目录不能被卸载，它作为守护进程的工作目录了）

5、标准输入、标准输出、标准错误重定向到/dev/null

下面分析一个客户端登录框架，如下图：

1.2 Linux中的进程 --- fork、vfork、exec函数族、进程退出方式、守护进程等分析

telnet客户端登录到服务器上，会进行用户名和密码的校验，校验成功后，也就登录完成了，服务器会创建一个会话期，然后在这个会话期中默认执行一个shell。然后这个shell会去用户目录下执行$HOME/.bash_profile文件，这个shell是为这个用户服务的。

　　这个登录相当于在客户端和服务器之间建立了一个会话期（session），在这个会话期里面可以有很多进程组，默认执行的shell就成为这个会话期中的一个进程组，当我们在这个shell上执行ps -ef | grep wbm01时，ps进程和grep进程成为一个进程组，它们和shell不属于一个进程组，但都在同一个会话期中。进程组组长的pid就是进程组的组号。现在执行的shell、ps、grep或者我们自己的hello程序都是和终端有关联的，所以它们都不是守护进程。

　　如果我们想要做一个后台服务程序即守护进程，那么我们必须从这个会话期中跳出来，单独创建一个会话期，在新会话期中有我们自己fork出来的进程myforkproc，这个进程就可以脱离中断的控制了，这就是守护进程。创建守护进程的过程可以按以上我们给出的步骤来进行，也可以使用daemon一步完成。创建一个新会话的时候不能是进程组组长来调用setsid，所以应该先fork一个子进程，让子进程来调用setsid。调用setsid的进程将成为新会话期的leader进程，会话期id就是这个进程的pid，这个进程也会是新会话期中一个进程组的组长。

　　跳出已有会话期，创建新会话期的框图如下：

1.2 Linux中的进程 --- fork、vfork、exec函数族、进程退出方式、守护进程等分析

演示程序如下：

 1 #include <sys/types.h>
 2 #include <unistd.h>
 3 
 4 #include <stdlib.h>
 5 #include <stdio.h>
 6 #include <string.h>
 7 
 8 #include <signal.h>
 9 #include <errno.h>
10 
11 int main()
12 {
13     pid_t pid;
14     
15     pid = fork();
16     
17     if(-1 == pid)
18     {
19         perror("fork error");
20         exit(-1);
21     }
22     
23     if(pid > 0)
24     {
25         exit(0);
26     }
27     
28     pid = setsid();
29     
30     if(-1 == pid)
31     {
32         perror("setsid error");
33         exit(0);
34     }
35     
36     sleep(100);
37     
38     printf("after deamon ...\n");
39     return 0;
40 }

执行程序，结果如下：

1.2 Linux中的进程 --- fork、vfork、exec函数族、进程退出方式、守护进程等分析

可以看到a.out进程对应的终端那一列显示的是“？”，问号就代表这个进程没有终端，就是后台守护进程。

　　根据创建守护进程的步骤，我们上面的程序还缺少两步，下面给出一个完整的程序：

 1 #include <sys/types.h>
 2 #include <unistd.h>
 3 
 4 #include <stdlib.h>
 5 #include <stdio.h>
 6 #include <string.h>
 7 
 8 #include <signal.h>
 9 #include <errno.h>
10 
11 #include <sys/stat.h>
12 #include <fcntl.h>
13 
14 
15 int main()
16 {
17     pid_t pid;
18     
19     pid = fork();
20     
21     if(-1 == pid)
22     {
23         perror("fork error");
24         exit(-1);
25     }
26     
27     if(pid > 0)
28     {
29         exit(0);
30     }
31     
32     pid = setsid();
33     
34     if(-1 == pid)
35     {
36         perror("setsid error");
37         exit(0);
38     }
39     
40     chdir("/");
41     int i = 0;
42     for(i = 0; i < 3; i++)
43     {
44         close(i);
45     } 
46     
47     open("/dev/null", O_RDWR);
48     dup(0);
49     dup(0);
50     
51     sleep(100);
52     
53     printf("after deamon ...\n");
54     return 0;
55 }

　　新添加的第40行将守护进程的工作目录设置为根目录，守护进程的工作目录默认为启动这个程序的目录，如果这个目录有被卸载的可能，则因为守护进程对这个目录的占用而不能卸载，所以要将工作目录设置为根目录。

　　工作目录设置完成，然后关闭标准输入、标准输出、标准错误，这时候0,1,2三个文件描述符就空闲了，打开/dev/null，这个文件就占用了0描述符，dup函数负责将0号文件描述符复制到文件描述符表中的空闲项中，本例中也就是1和2。

　　下面我们演示调用daemon来创建守护进程，程序如下：

 1 #include <sys/types.h>
 2 #include <unistd.h>
 3 #include <stdlib.h>
 4 #include <stdio.h>
 5 #include <errno.h>
 6 
 7 int main()
 8 {
 9     daemon(0, 0);
10     
11     printf("after ...\n");
12     return 0;
13 }

　　第一个参数0表示改变工作目录，第二个参数0表示关闭标准输入、标准输出、标准错误，第二个参数为0时，没有任何打印，因为标准输出关闭了，重定向到了/dev/null，如果第二个参数不为零，执行结果如下：

1.2 Linux中的进程 --- fork、vfork、exec函数族、进程退出方式、守护进程等分析

最后一句话打印出来了，说明守护进程没有关闭标准输出。

秒客网

1.2 Linux中的进程 --- fork、vfork、exec函数族、进程退出方式、守护进程等分析

相关文章