知识点查缺补漏贴02:Linux环境fork()函数详解

时间:2022-11-27 19:46:45

引言

先来看一段代码吧,

 #include <sys/types.h>
#include <unistd.h>
#include <stdio.h>
#include <stdlib.h> int main(int argc, char **argv)
{
pid_t pid = fork();
if(pid < ){
fprintf(stderr,"error!");
}else if( == pid){
fprintf(stderr,"This is the child process.\r\n");
}else{
fprintf(stderr,"This is the parent process.\r\n");
}
return ;
}

执行后输出:

This is the parent process.

This is the child process.

是不是感觉比较奇怪,按照if结构的规则,应该只执行一个才对,也正因为此,fork()函数曾经迷惑了不少Linux/Unix平台的开发者。那么为什么呢?

一、函数原型

  pid_t fork( void);

  返回值: 若成功调用一次则返回两个值,子进程返回0,父进程返回子进程ID;否则,出错返回-1

二、函数说明

  一个现有进程可以调用fork函数创建一个新进程。由fork创建的新进程被称为子进程(child process)。fork函数被调用一次但返回两次。两次返回的唯一区别是子进程中返回0值父进程中返回子进程ID。子进程是父进程的副本,它将获得父进程数据空间、堆、栈等资源的副本。注意,子进程持有的是上述存储空间的“副本”,这意味着父间子进程间不共享这些存储空。

  UNIX将复制父进程的地址空间内容给子进程,因此,子进程有了独立的地址空间。在不同的UNIX (Like)系统下,我们无法确定fork之后是子进程先运行还是父进程先运行,这依赖于系统的实现。所以在移植代码的时候我们不应该对此作出任何的假设。

  关键词:子进程中返回0  父进程中返回子进程ID(>0);调用一次返回两次;复制父进程地址空间内容(非地址)给子进程;子进程拥有独立的地址空间;无法确定执行顺序;

三、为何fork函数会返回两次

  先来看一个图:

  知识点查缺补漏贴02:Linux环境fork()函数详解

  由于在复制时复制了父进程的堆栈段,所以两个进程都停留在fork函数中,等待返回。因此fork函数会返回两次,一次是在父进程中返回,另一次是在子进程中返回,这两次的返回值是不一样的。调用fork之后,数据、堆栈有两份,代码仍然为一份但是这个代码段成为两个进程的共享代码段都从fork函数中返回,如上图箭头表示各自的执行处。当父子进程有一个想要修改数据或者堆栈时,两个进程真正分裂。