【Linux】进程控制基础知识

这篇具有很好参考价值的文章主要介绍了【Linux】进程控制基础知识。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

目录

一,fack回顾 

二,进程终止

1.进程终止,操作系统做了什么?

2.进程终止,常见的方式

1.main函数的,return + 返回码

2. exit()函数

三,进程等待 

1. 回收进程方法

(1. wait方法

补充理解:僵尸进程与内存泄露区别

(2.waitpid函数

a,参数pid 

b, 参数status

c, 参数options

四,进程替换

1,概念与原理 

2,进程替换方法

3. 尝试fork + execl函数

其他函数补充:

4. 如何利用execl函数运行其他可执行程序

五,练习——制作一个简单的shell命令解释器

1. 制作框架方面:

2. 接收,并处理指令

3. 子进程替换,父进程等待

结语


【Linux】进程控制基础知识,Linux,linux,服务器

一,fack回顾 

在linux中fork函数时非常重要的函数,它从已存在进程中创建一个新进程。新进程为子进程,而原进程为父进程。
#include <unistd.h>
pid_t fork(void);
返回值:自进程中返回0,父进程返回子进程id,出错返回-1
进程调用fork,当控制转移到内核中的fork代码后,内核做:
  1. 分配新的内存块和内核数据结构给子进程;
  2. 将父进程部分数据结构内容拷贝至子进程;
  3. 添加子进程到系统进程列表当中;
  4. fork返回,开始调度器调度。

【Linux】进程控制基础知识,Linux,linux,服务器

由于前面已经出现了fork的理解,这里不做详解。 

前面地址空间章节(【Linux】地址空间概念_花果山~~程序猿的博客-CSDN博客)我们已经初步了解了在创建子进程时,系统会采用写时拷贝这项决策,我们可以反向思考,如果系统直接拷贝一份给子进程呢?我们知道进程 = 内核数据结构 + 代码&数据,进程一旦被创建,代码是处于只读的状态,但数据可以转为可写,这样我们为啥不拷贝一份数据给子进程?因为系统是不知道那些数据是要被使用的,所以拷贝一份不怎么被使用的数据会导致内存利用率下降。

所以关于为何OS选择写时拷贝技术,对父子进程进行分离?

1.用的时候,给子进程分配,是一种高效的内存表现。

2.系统在执行代码时,无法的知道那些内存会被访问。

数据修改前后: 

【Linux】进程控制基础知识,Linux,linux,服务器

结论:在计算机系统中,当父进程创建子进程时,子进程会继承父进程的代码和数据。初始时,这些代码和数据的权限是只读的。当子进程需要修改这些代码和数据时,会进行写时拷贝操作,即将需要修改的部分数据的权限从只读变为可写。

二,进程终止

1.进程终止,操作系统做了什么?

进程终止,操作系统释放进程所申请的内核数据机构,代码和数据,其本质上就是内存释放。

2.进程终止,常见的方式

1.main函数的,return + 返回码

我们在编写一个C/C++程序时,运行起来,会有以下情况:

 (a,代码跑完,结果正确;

   (b,代码跑完,结果不正确;

我们在编写main函数时,往往都会返回一个0(不总是0),这是进程退出码,是提供给上一级父进程的,如果返回的不是0就代表结果不正确;反之,正常退出,则返回0;

补充: 获取上一次进程退出码指令 echo  $?

那main()函数返回值有什么意义呢?

当我们在shell脚本中调用一个程序时,可以通过检查该程序的main函数返回码来确定程序是否成功执行。如果返回码为0,则表示程序执行成功;而如果返回码为其他非零值,则表示程序执行失败或出现错误。通过这种方式,我们可以根据main函数的返回码来进行后续的处理(意味着得程序跑完,才会有后续处理),例如输出相应的提示信息或进行错误处理(比如:strerror()函数的错误原因)。(来自chatgpt)

 (c,代码未跑完,程序奔溃。(这里在信号部分讲解)

2. exit()函数

exit在代码任何地方调用,都会终止进程。这里补充一个系统层面的接口_exit()

接下来我们来实验一下两者的区别:

行缓冲区,如果我们不添加换行符,打印数据会先存放到缓存区,在进程结束后刷新到显示器。

    int main()
  6 {
  7   cout << "lisan";
  8   sleep(3);
  9   exit(11); // _exit(11);                                     
 10   return 0;                    
 11 }                              
 12      

尝试两个函数,_exit()函数在进程退出时不会打印lisan,下面是原因示意图。

【Linux】进程控制基础知识,Linux,linux,服务器

由于_exit()直接终止程序,所以缓冲区的数据没有被刷新出。那这里我们会想缓冲区在那里呢?我们知道_exit()是操作系统的接口,exit()是库函数,因此我们可以大概猜到管理缓冲区的程序在操作系统之上


三,进程等待 

为什么需要进程等待?父进程需要拿到一个数据,创建子进程,等待子进程返回数据,父进程才能进入下一步操作。以及,子进程退出,如果父进程提前退出,子进程则变成僵尸进程,造成内存泄露。

总之;

  1. 之前讲过,子进程退出,父进程如果不管不顾,就可能造成‘僵尸进程’的问题,进而造成内存泄漏。
  2. 另外,进程一旦变成僵尸状态,那就刀枪不入,“杀人不眨眼”的kill -9 也无能为力,因为谁也没有办法杀死一个已经死去的进程。
  3. 最后,父进程派给子进程的任务完成的如何,我们需要知道。如,子进程运行完成,结果对还是不对,或者是否正常退出。
  4. 父进程通过进程等待的方式,回收子进程资源,获取子进程退出信息。

执行下面程序:

        int main()
  6 {
 12     pid_t pd = fork();
 14     if (pd < 0)
 15     {
 16       // 程序失败
 17       perror("fork ");
 18     }else if(pd == 0)
 19     {
 20       // 子进程
 21       int a = 5;
 22       while(a--)                                                   
 23       {
 24       printf("是子进程:getpid:%d,getppid:%d\n",getpid(), getppid()    );
 25       sleep(1);
 26       }      
 27     }else{
 28       // 父进程
 29       while(1)
 30       {
 31       printf("是父进程:getpid:%d,getppid:%d\n",getpid(), getppid()    );
 32       sleep(1);
 33       }   
 34     }
 35 }

 【Linux】进程控制基础知识,Linux,linux,服务器

那我们如何接收进程呢?(虽然父进程提前结束,子进程会被操作系统领养,回收,这种思路:是一种编程思路,我们以后会学习到)

1. 回收进程方法

(1. wait方法

【Linux】进程控制基础知识,Linux,linux,服务器

#include<sys/types.h>
#include<sys/wait.h>
pid_t   wait(int*  status);
返回值: 成功返回被等待进程pid ,失败返回 -1
参数: 输出型参数,获取子进程退出状态, 不关心则可以设置成为 NULL

【Linux】进程控制基础知识,Linux,linux,服务器

补充理解:僵尸进程与内存泄露区别

我们知道子进程一旦进入僵尸状态,其代码和数据虽然可以被释放,但其PCB(task_struct)的内核数据结构会被保留,如果操作系统一直不回收那么也属于内存泄露;在我们编写的应用程序中,我们通过new,malloc向堆区申请的内存,需要我们在使用完后进行释放,否则会造成内存泄露。理解:

这两种泄露前者是操作系统级别的,后者是进程中,后者进程退出,系统回收内存,不存在内存泄露;前者操作系统不处理僵尸进程的PCB是永远回收不了这些内存的。

(2.waitpid函数

pid_ t   waitpid(pid_t pid, int* status, int options);

【Linux】进程控制基础知识,Linux,linux,服务器 

首先我们讲讲其意义:waitpid函数是Linux系统中用来等待子进程状态改变的函数,它可以 阻塞父进程, 直到指定的子进程状态发生变化。避免父进程提前退出,让子进程变成孤儿进程。 
返回值:
1. 当正常时, 返回收集到的子进程的进程 ID
2. 如果 optiion 设置了选项 WNOHANG(0)(不等待),    而调用中 waitpid 发现没有已退出的子进程可收集,则返回0
2. 如果调用中出错 , 则返回 -1, 这时 errno 会被设置成相应的值以指示错误所在; 

a,参数pid 

Pid=-1,  等待任一个子进程。与 wait 等效。
Pid>0. 等待其进程 ID pid 相等的子进程。

 补充一点关于status的知识,我们知道其是用来记录子进程返回码的,同时我们也知道程序运行结束会有三种情况

【Linux】进程控制基础知识,Linux,linux,服务器那怎么从status上表达这不同情况?

b, 参数status

wait和waitpid,都有一个status参数,该参数是一个 输出型参数,由操作系统填充。
如果传递NULL,表示不关心子进程的退出状态信息。否则,操作系统会根据该参数,将子进程的退出信息反馈给父进程。 status不能简单的当作整形来看待,可以当作位图来看待,具体细节如下图(只研究status低16比特位——小端机器)
status是int类型不管是32位还是64位机器,我们只看前15位, 下图就是前15位信息分布

 【Linux】进程控制基础知识,Linux,linux,服务器

 所以我们怎么取得退出状态??

(status >> 8) & 0xff    //  0xff ->  0000 0000....1111  1111保留最后8个比特位

【Linux】进程控制基础知识,Linux,linux,服务器

这是进程正常结束,那进程异常结束呢?我们知道进程异常退出,其实是系统杀掉了进程,系统向进程发送杀掉信号。进程一但异常退出,那么其进程返回码就失去了意义。

所以如何获取这个信号呢?

(status >> 7) & 0x7F   // 0000...  111 1111 保留最后7个比特位,(注意:如果status如果已经进行位向右移,这次的位运算是会在上次的基础上向右移)

【Linux】进程控制基础知识,Linux,linux,服务器

注意:进程异常结束,不都是进程内部代码问题,也有可能是外部原因,比如:kill -9  杀死进程,错误消息就是9

但是,这个还得知道status的组成,然后需要进行位运算,这个了解还行,但使用长期下来不方便,因此,为了使用方便提供了如下:

常用获取进程退出情况(推荐) 

WIFEXITED(status) (查看进程 是否是正常退出  ):         若为正常终止子进程返回的状态,则为真。
WEXITSTATUS(status) (查看 进程的退出码 )      :    若WIFEXITED非零,提取子进程退出码。

补充:

【Linux】进程控制基础知识,Linux,linux,服务器

c, 参数options

设置一: option参数:默认为0,表示子进程运行时,父进程为阻塞等待

设置二:WNOHANG 参数,是一个宏定义,表示父进程为非阻塞状态。(WNOHANG理解:HANG是一种专业的术语,如果一个进程卡死,这个进程要么在阻塞队列中,要么等地被调度,所以称作这个进程HANG住了。所以NOHANG就是非阻塞等待)

下面是 waitpid函数伪代码,在操作系统内核中的大致实现思想

【Linux】进程控制基础知识,Linux,linux,服务器 那非阻塞等待,难道是不等待子进程?本质上,非阻塞等待是基于非阻塞调用的轮询方案,说人话是,我找张三帮忙,张三说在忙,我先做我的事,然后每过一分钟给他打个电话,查看他是事是否做完。

四,进程替换

1,概念与原理 

     用 fork 创建子进程后执行的是和父进程相同的程序 ( 但有可能执行不同的代码分支 ), 子进程往往要调用一种 exec 函数以执行另一个程序。当进程调用一种exec 函数时 , 该进程的用户空间代码和数据完全被新程序替换 , 从新程序的启动例程开始执行。调用exec 并不创建新进程 , 所以调用 exec 前后该进程的 id 并未改变。(意味着调用exec不会创建新的子进程)

【Linux】进程控制基础知识,Linux,linux,服务器

2,进程替换方法

方法:通过execl函数

我们问问man

【Linux】进程控制基础知识,Linux,linux,服务器

今天我们来学习最简单的execl。

int execl (const char* path, const char*  arg, ...)   // 路径 , 命令行上该怎么写就怎么写

path : 目标程序的地址+路径

arg:   函数参数

...  : 的意思是可变参数列表,注意点:参数列表必须以NULL结尾,这表示参数提取结束。

下面是例子:

【Linux】进程控制基础知识,Linux,linux,服务器

 从上面的观察中发现:

1. 进程替换后,"进程结束"没有打印,这一点可以佐证,一旦execl函数调用成功,原来进程的代码和数据全部被替换为新进程。

2. 如果execl调用失败,继续原来进程,不过这时可以直接终止进程。

3. 尝试fork + execl函数

看下面代码:

  1 #include <iostream>
  2 #include <unistd.h>
  3 #include <sys/types.h>
  4 #include <sys/wait.h>
  5 using namespace std;
  6 
  7 int main()
  8 {
  9    pid_t pd = fork();
 10    if (pd == 0)
 11    {
 12     // 子进程
 13      cout << "子进程开始, pid:" << getpid() <<  endl;
 14      execl("/usr/bin/ls", "ls","-l", "-a", "--color=auto", NULL);
 15      exit(-1);
 16 
 17    }else if (pd)
 18    {
 19      // 父进程
 20      int status = 100;
 21      cout << "父进程开始" << endl;
 22      pid_t ret = waitpid(-1, &status, 0);                               
 23      if (ret)
 24      {
 25        cout << "子进程退出,打印子进程退出码:" << WEXITSTATUS(status) <<    endl;
 26      }else 
 27      {
 28        cout << "子进程未退出" << endl;
 29      }
 30 
 32    }
 33    else 
 34    {
 35      cout << "创建子进程失败" <<endl;
 36    }
 37   return 0;
 38 }

结果:【Linux】进程控制基础知识,Linux,linux,服务器

问:为什么要创建子进程来替换呢?

答:为了实现父进程读取数据,分析数据,然后指派子进程去完成某项任务的思想。

问:父子进程代码共享,数据写时拷贝?那execl函数替换进程了呢?代码是否会进行写时拷贝?

答:会,因为如果父子进程共享,在调用execl函数时,会对代码进行写时拷贝,否则父进程会受到影响。

其他函数补充:

进程替换函数其实还是有挺多接口的,如下:

【Linux】进程控制基础知识,Linux,linux,服务器

1. execv 函数,使用一图流如下:【Linux】进程控制基础知识,Linux,linux,服务器

2. execlp函数,【Linux】进程控制基础知识,Linux,linux,服务器

3. execvp函数,这个就挺容易用的,可以这么理解,指令方式以Vector存储,并且“P”省略文件路径,自动搜索环境变量。

4. execle函数,"e"表示的则是环境变量的意思,通过传递环境变量给新程序,可以在新程序中使用这些环境变量的值。例如,可以通过设置环境变量来影响新程序的行为,或者传递一些需要在新程序中使用的配置信息。

下面是一个示例,展示了如何使用execle函数传递环境变量:

#include <unistd.h>

int main() {
    char *envp[] = {"MYVAR=Hello", "OTHERVAR=World", NULL};
    execle("/path/to/program", "/path/to/program", NULL, envp);
    return 0;
}

在上面的示例中,我们定义了两个环境变量MYVAROTHERVAR,并将它们传递给新程序。新程序可以使用getenv函数来获取这些环境变量的值。

需要注意的是,使用execle函数时,必须传递完整的环境变量数组,包括系统默认的环境变量。如果只想传递自定义的环境变量,可以使用execve函数(这是真正的系统调用,其他exec**函数都只是封装),并将environ变量作为参数传递给它。(来自chatgpt)

这里有个值得注意的点,即使是进程替换,环境变量是系统方面的数据,子进程会拷贝一份父进程的环境变量,且不会被替换。 

命名总结:

这些函数原型看起来很容易混 , 但只要掌握了规律就很好记。
l(list) : 表示参数采用列表
v(vector) : 参数用数组
p(path) : 有p自动搜索环境变量PATH
e(env) : 表示自己维护环境变量

4. 如何利用execl函数运行其他可执行程序

诺,下面是我在Test程序上调用mypro程序。 

【Linux】进程控制基础知识,Linux,linux,服务器

makefile: 可以做到一次编译多个文件。

最右侧的图,运用到了命令行参数,可参考本博客中命令行参数部分【Linux】进程基础概念【下篇】-CSDN博客 

到这里我们,我们可以理解exec***函数的功能——底层加载器的接口

五,练习——制作一个简单的shell命令解释器

 目标:【Linux】进程控制基础知识,Linux,linux,服务器

制作一个能读取,并执行指令的shell。

shell执行命令:

【Linux】进程控制基础知识,Linux,linux,服务器

1. 制作框架方面:

我们需要制作一个死循环,不断的接收指令。

// 属于是死循环
   13   while (1)
   14   {
   15     // 首先是打印地址
   16     cout << "[afeng@_myshell]$ ";
   17     fflush(stdout); // 解决缓冲区的问题
        }

我们可以简单打印一个shell名,但不能换行,但不能换行,就会有缓冲区的问题,通过fflush函数刷新即可。

2. 接收,并处理指令

不能使用cin, scanf 因为,指令伴随空格,cin,scanf遇到空格提前结束输入,这里我们采用可以接收空格字符的函数,比如:getline, 输入流函数fgets。我们首先将指令保存到指针数组中,由于我们只是简单制作一个shell,所以指令程序我们选择调用,而选择调用我们就要进行进程替换。(说到这里我们需要区分的是,我们利用子进程替换仅仅是为了启动其他程序,父进程的未层修改。)使用进程替换函数exec***,我们就得将指令分割下来。

    // 然后开始接收指令
   20     char instruct[NUM];
   21     memset(instruct, '\0', sizeof instruct);
   22     if (fgets(instruct, sizeof instruct, stdin) == NULL)
   23     {
   24       continue;
   25     }
   26     instruct[strlen(instruct) - 1] = '\0';
          // 在输入指令后,我们会通过回车键确认,但回车键被当做'\n'记录,所以需要纠正。
   27 
   28     // 开始拆分出指令
   29     char* argv[100] = {0};
   30     argv[0] = strtok(instruct," ");
   31     int i = 1;                                                        
W> 32     while (argv[i++] = strtok(NULL, " "));

3. 子进程替换,父进程等待

接下来就是子进程与父进程的编写,子进程替换,我们知道我们在Linux中能不带路径的执行相应指令的基础是其路径已经存在环境变量中,所以系统会自动搜索。

36     // 内置命令 1.我们通过子进程替换打印我们需要的结果,父进程不受影响
   37     // 当需要更改路径时,目标是父进程
   38     if (strcmp(argv[0],"cd") == 0)
   39     {
   40         if (argv[1] != NULL)
   41           chdir(argv[1]);
   42         continue;
   43     }
   44 
   45     pid_t pd = fork();
   46     if (pd == 0) // child
   47     {
   48       execvp(argv[0], argv);
   49       exit(-1);                                                       
   50     }
   51     else{
   52       // parent
   53       int status;
   54       pid_t ret = waitpid(pd, &status, 0);
   55       if (ret > 0 )
   56       {
   57         cout << "子进程运行成功,退出码:" << WEXITSTATUS(status)<< endl;
   58       }else{
   59         cout << "子进程运行失败,退出码:" << WEXITSTATUS(status)<< endl;
            }
   61     }
   62   }
   63   return 0;
   64 }

结语

   本小节就到这里了,感谢小伙伴的浏览,如果有什么建议,欢迎在评论区评论,如果给小伙伴带来一些收获请留下你的小赞,你的点赞和关注将会成为博主创作的动力文章来源地址https://www.toymoban.com/news/detail-717700.html

到了这里,关于【Linux】进程控制基础知识的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • Linux基础知识3

    Linux基础知识 适合有Linux基础的人群进行复习。 禁止转载! Linux系统下的3类用户和功能; 答:         root用户(或称根用户、超级用户):Linux的内置用户,权限最高,具有读、写、执行系统所有文件的权限,可以更改系统配置、管理用户、安装软件等操作。        

    2024年02月08日
    浏览(39)
  • Linux基础知识4

    Linux基础知识 适合有Linux基础的人群进行复习。 禁止转载! shell第一行内容格式?         #!/bin/sh,#!/bin/bash,#!/bin/csh,#!/bin/tcsh,#!/bin/ksh等 执行shell脚本的三种方式       (1)为shell脚本直接加上可执行权限再执行,如:                 chmod 755 ljh.sh       /

    2024年02月08日
    浏览(49)
  • Linux基础知识笔记

    记录linux基础知识,持续更新中… /dev/null 是一个特殊的设备文件,可以将数据重定向到这个文件中,从而实现将输出或错误信息丢弃的效果。在 Linux 系统中, /dev/null 被称为“黑洞”,因为所有写入它的数据都会被立即丢弃,无法恢复。 在 Shell 脚本中,可以使用 符号将输出

    2024年02月07日
    浏览(45)
  • linux基础知识学习记录

    计算机组成:计算机主要硬件和软件2部分组成。 计算机软硬件的概念:硬件是可以看得见的物理实体,软件是运行在硬件上不可见的程序。 计算机软硬件的关系:没有硬件,程序就不会存在;没有软件,硬件就是破铜烂铁。 计算机硬件的组成:CPU(中央处理器)、内存、硬盘

    2024年02月07日
    浏览(44)
  • Linux Shell基础知识

    预计更新 1: 基础知识 简介和安装 基本命令 变量和环境变量 2: 流程控制 条件语句 循环语句 函数 3: 文件处理 文件读写 文件权限和所有权 文件搜索和替换 4: 网络和进程 网络通信 进程管理 信号处理 5: 文本处理 正则表达式 文本分析和处理 生成报告和日志 6: 用户界面 命令行

    2024年02月11日
    浏览(48)
  • linux基础知识-sar详解

    sar(System Activity Reporter系统活动情况报告)是目前Linux比较全的系统性能分析工具之一,可以从多方面对系统的活动进行报告 ,包括:文件的读写情况、系统调用的使用情况、磁盘I/O、CPU效率、内存使用状态、进程活动有IPC有关的活动等。 sar 还可以配置配置信息收集历史指标。

    2024年02月10日
    浏览(50)
  • Linux常见指令和基础知识

    从这一章开始我们就要正式的进入我们的Linux的学习了,在正式学习之前我们要先熟悉一下Linux的操作和一些基础知识吧。 语法: ls [选项][目录或文件] 功能:对于目录,该命令列出该目录下的所有子目录与文件。对于文件,将列出文件名以及其他信息。 常用选项: 操作演示

    2024年02月07日
    浏览(38)
  • Linux基础知识及常见指令

    什么是Linux? Linux是一个免费开源的操作系统内核,最初由Linus Torvalds于1991年创建。它是各种Linux发行版(通常称为“发行版”)的核心组件,这些发行版是完整的操作系统,包括Linux内核以及各种软件包,如系统实用工具、库和桌面环境等。 什么是Linux终端? Linux 的终端就是

    2024年02月09日
    浏览(37)
  • Linux基础知识点2

    Linux基础知识 适合有Linux基础的人群进行复习。 禁止转载! 文件管理与常用命令 Linux的文件的组成部分:        文件名 、 inode (i节点)和 block (真正存数据的区域)。 查看某个文件的属性:            ls -lh     #可看到有类似”-rw-r--r--”的属性符号           第

    2024年02月09日
    浏览(51)
  • 系统级基础信号知识【Linux】

    目录 一,什么是信号  进程面对信号常见的三种反应概述 二,产生信号 1.终端按键产生信号 signal 2. 进程异常产生信号 核心转储 3. 系统调用函数发送信号 kill raise abort 小结: 4. 由软件条件产生 alarm 5. 硬件异常产生信号 三,信号其他概念 1. 进程中储存信号的内核结构 2. s

    2024年02月04日
    浏览(45)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包