【Linux】进程的基本属性|父子进程关系-Toy模板网

这篇具有很好参考价值的文章主要介绍了【Linux】进程的基本属性|父子进程关系。希望对大家有所帮助。如果存在错误或未考虑完全的地方，请大家不吝赐教，您也可以点击"举报违法"按钮提交疑问。

【Linux】进程的基本属性|父子进程关系,Linux,linux,运维,服务器

个人主页：🍝在肯德基吃麻辣烫
我的gitee：Linux仓库
个人专栏：Linux专栏
分享一句喜欢的话：热烈的火焰，冰封在最沉默的火山深处

前言

本篇文章继上文的进程概念后，现在对进程概念有了一定的理解。前面说过，操作系统管理进程实际上是管理描述进程的PCB对象，而PCB对象是一堆进程属性的集合，那么进程都有哪些属性？本篇文章会详细写出来。

进程属性

我们知道，进程 = 描述该进程的PCB结构体对象 + 对应的数据和代码，每一个进程都是由操作系统进行管理的，进程的PCB（process ctrl block）对象是该进程的所有属性的集合，所以，一个进程的多种属性，一定是放在PCB结构体里面的。

下面介绍进程的基本属性。

1.进程PID和PPID

什么是PID？PID我们可能不知道，但是ID我们应该是知道的，ID就是身份识别码。所以PID就是进程的身份识别码（process ID）

在学校里面，每一个学生都有自己的学号，这个学号是独一无二的，进程也是类似，每一个进程的PID是独一无二的。

我们可以通过下面的指令来查看进程的PID。

ps axj | head -1

ps axj 指令可以查看当前用户下的所有进程，通过管道后，head指令提取管道文件的第一行并输出到显示器中。
结果如下:

【Linux】进程的基本属性|父子进程关系,Linux,linux,运维,服务器
第二个就是PID。

这里有一个注意的点，既然PID是该进程的唯一身份标识符，则该进程的PID一定是放在task_struct结构体中的，因为PID也是进程的属性之一。PID的本质是一个int类型。

这里有一个问题：我如何获取自己进程的PID？
【Linux】进程的基本属性|父子进程关系,Linux,linux,运维,服务器
从上面的描述过程中可以画出该图，ps axj指令能获取用户正在运行的所有进程，这些进程的信息本质上是ps axj这条程序员写的指令去调用操作系统开放的一个接口调用到的。

因为操作系统不相信任何人，它不敢也不给任何人访问我的所有进程的PCB结构体和各种信息。

所以可以想到，要想获取一个进程的PID，要通过一个系统调用接口来获取，这个接口叫做getpid()

【Linux】进程的基本属性|父子进程关系,Linux,linux,运维,服务器

下面来通过代码让操作系统给我们分配一个小小的进程：

  1 #include <stdio.h>
  2 #include <unistd.h>
  3 
  4 int main()
  5 {
  6     pid_t pid = getpid();
  7    
  8     while(1)
  9     {
 10                                                               
 11         printf("I am a process,my pid is %d\n",pid);
 12         sleep(1);
 13     }
 14 
 15     return 0;
 16 }

运行后，再查询该进程的pid
【Linux】进程的基本属性|父子进程关系,Linux,linux,运维,服务器
发现通过系统的接口函数返回的pid和我们运行程序时正在跑的进程的pid是一样的。

getpid()这个系统调用接口的工作原理是，我自己的进程调用getpid()函数，获取到我的PID后将结果返回给上层的一个变量。

不过这又有一个小细节，PPID是什么？

PPID，比PID多了一个P，这个P是parent的意思，也就是父进程的PID。
父进程就是该进程的父亲进程，就相当于我这个进程是父进程分配下来的。

我们再重新执行程序会发现，我原来的进程的PID变了。这就像是我们上大学后，发现我这个学校并不如意，我决定回去复读，第二年我比去年多考了几十分，可天意难料，我又被去年的学校录取了。这个过程中，去年我读的这所学校分配给我一个学号，今年再来到这所学校，也有一个学号，这两个学号肯定是不一样的。

那么，我们这样通过写代码的方式创建一个进程，它的父进程到底是谁？
【Linux】进程的基本属性|父子进程关系,Linux,linux,运维,服务器
我们查询一下可以发现，每次执行程序，它的PID都不同，但是PPID都是一样的，找到PID为2215的那一行可以发现，它的COMMAND就是对应的进程对象。

由此可知，每一个自己创建的进程的父进程都是bash进程！
不过，bash进程的PID也是会变化的，重新启动xhell脚本就得到不一样的PID了。

2.fork函数创建子进程

fork函数的作用是：创建一个子进程。
【Linux】进程的基本属性|父子进程关系,Linux,linux,运维,服务器
这里是fork函数的基本说明，然而，重要的是fork函数的返回值：

【Linux】进程的基本属性|父子进程关系,Linux,linux,运维,服务器

如果创建成功：返回子进程的pid给父进程，返回0给子进程。
如果创建失败，返回-1给父进程，子进程则什么都不返回。

下面给一段代码演示一下fork函数。

  1 #include<stdio.h>                                                                                                                    
  2 #include<unistd.h>
  3 
  4 int main()
  5 {
  6     printf("begin:我是一个进程,我的pid是%d,我的ppid是%d\n",getpid(),getppid());
  7     pid_t id = fork();
  8 
  9     if(id == 0)
 10     {
 11         //子进程
 12          while(1)
 13          {
 14             printf("我是子进程,我的pid是%d,我的ppid是%d\n",getpid(),getppid());
 15             sleep(1);
 16          }
 17     }
 18 
 19     else if(id > 0)
 20     {
 21         //父进程
 22         while(1)
 23         {
 24             printf("我是父进程,我的pid是%d,我的ppid是%d\n",getpid(),getppid());
 25             sleep(1);
 26         }
 27     }
 28 
 29     return 0;
 30 }

【Linux】进程的基本属性|父子进程关系,Linux,linux,运维,服务器

运行后你会发现结果如上：

执行第一个printf语句后，打印的pid和ppid就是当前正在运行进程的pid和ppid。

然后你会发现同时执行了if 和else if 两个语句块！

这到底是什么原因呢？

看运行结果可知，父进程的pid和ppid跟第一个printf打印出来的是一模一样的！说明父进程就是当前这个程序的进程！而子进程是父进程的一个分支！

这里还有几个问题需要解决：

1）为什么fork函数要给父进程返回子进程的pid，给子进程返回0？

举个简单的例子，每一个孩子一定只有一个亲生父亲，但是每一个父亲可能会有多个孩子，这是毋庸置疑的。假如一个父亲有5个孩子，父亲说：孩子，你过来。然后5个孩子齐刷刷地跑过来，父亲到底叫的是哪个孩子呢？

所以就必须让父进程知道每一个子进程的标识符！
也就是要知道每一个子进程叫什么名字，返回子进程的pid给父进程是最合理的。

而对于子进程来说，它的父进程只有一个且不花什么代价就能找到父进程pid，所以只需要返回0给子进程作为标识即可。

2）fork函数究竟在干什么？

要知道，fork函数的功能是创建一个子进程，可是到底什么叫做创建一个子进程？
其实，创建子进程，无非就是系统中多了一个进程！

我们知道，进程 = PCB数据结构 + 自己的代码和数据，多一个进程就是在操作系统中多管理一个PCB数据结构和一段代码罢了。

可是，子进程刚创建出来并没有代码和数据，所以子进程只能去找父进程的代码和数据来执行。

【Linux】进程的基本属性|父子进程关系,Linux,linux,运维,服务器
这就是为什么，fork函数之后的所有代码是父子进程共享的！

这就解释了从fork函数之后下面的代码，父进程和子进程都能跑的原因。

那为什么要创建子进程？
因为在不同的场景中，我们需要让父子进程执行不同的代码块！
前面我们说过，fork函数之后父子进程共享代码，虽然是共享，实际上就是为了让父子进程执行不同的代码块，完成不同的工作从而协调起来。

3）一个函数是如何做到返回两次的？

前面说过，fork函数之后的代码父子共享。 但是，fork函数，也是一个函数，是在系统内部实现的，调用的时候会在fork函数内部创建进程，大致会做几件事情：

【Linux】进程的基本属性|父子进程关系,Linux,linux,运维,服务器

1.创建子进程的PCB对象
2.初始化子进程的PCB
3.让子进程指向父进程的数据和代码
4.让父子进程都能被CPU调度运行

前面说过，父子进程的代码是共享的，所以在return id这条代码，一定是父子共享的！ 因为在return id语句执行之前，已经做好了创建子进程的工作。CPU可以单独调用父子进程执行不同的工作。

所以return id这条语句被执行了两次！

可是前面说过，子进程是没有任何数据和代码的，子进程的代码也是人家父进程的，何况只有一个pid变量，该怎么接收两个返回值呢？

这里引出一个进程的性质：

任何平台下，任何一个进程在运行时，都具有独立性！

如何理解独立性？

我们在windows系统下面，我现在打开网页版csdn和xhell还有qq，突然我的qq崩溃了，但这并不影响我的网页运行，也不影响我在听音乐，这就是独立性，各个进程运行互不干扰。

既然进程有独立性，这就保证了每个进程之间不能有任何瓜葛，必须让它们割裂！
所以，父子进程一定不能访问同一份数据！

在这个前提下，子进程要想运行起来，必须要有自己的一份数据，所以，子进程只能想办法把父进程的数据拷贝下来！

这样就能够保证父子进程既能够保持父子进程的代码共享，又能保证父进程的数据不能被修改。保证父子共享代码的同时，又保证了进程的独立性。

可是，如果我的父进程有很多很多个变量，而子进程拷贝了父进程的数据，又不会去改这些变量，甚至不访问这些变量，就会造成在内存中有两份冗余的数据！为了解决这个问题，程序员想出一个好办法：写时拷贝

写时拷贝

写时拷贝是指：子进程在执行了return id这一条语句后，不会立刻去拷贝父进程的所有数据，而是先看子进程需要什么数据，再根据这些数据开辟需要的空间，这样就能避免数据冗余的情况。

后续如果子进程还需要数据，操作系统再给子进程空间并拷贝过去即可。

【Linux】进程的基本属性|父子进程关系,Linux,linux,运维,服务器

通过写时拷贝，实现父子进程的独立性，保证父进程的数据不会被修改，又能保证父子进程的代码共享！

总结

1.本篇文章讲述了进程的最基本的属性：进程的PID和PPID，PID是每个进程独有的标识序号，PPID是该进程的父进程的标识序号。
2.通过fork函数创建出来子进程。什么是创建子进程，以及给了一个案例，运行后发现了令人震惊的结果，提出了fork函数之后父子进程的代码是共享的，但是每个进程都具有独立性，父进程的数据绝对不能让子进程修改，从而产生写时拷贝的做法，来保证父子进程既能够具有独立性，也能让父子进程代码共享。文章来源地址https://www.toymoban.com/news/detail-652802.html

到了这里，关于【Linux】进程的基本属性|父子进程关系的文章就介绍完了。如果您还想了解更多内容，请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章，希望大家以后多多支持TOY模板网！