【Linux】 由“进程”过渡到“线程” -- 什么是线程(thread)?

这篇具有很好参考价值的文章主要介绍了【Linux】 由“进程”过渡到“线程” -- 什么是线程(thread)?。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

知识引入

如何看待地址空间和页表:

  1. 地址空间是进程能看到的资源窗口
  2. 页表决定,进程真正拥有资源的情况(页表映射多少才是拥有多少)
  3. 合理的对地址空间+页表进行资源划分,我们就可以对一个进程所有的资源进行分类

虚拟地址如何找到物理地址:
【Linux】 由“进程”过渡到“线程” -- 什么是线程(thread)?,Linux基础,linux,运维,服务器,进程,线程
最后一级页表存放的是页框的起始物理地址然后通过虚拟地址后12位为页内偏移量→物理地址


初识线程

1.什么叫做进程?

【Linux】 由“进程”过渡到“线程” -- 什么是线程(thread)?,Linux基础,linux,运维,服务器,进程,线程
进程组成:PCB + 地址空间 + 页表 + 物理内存映射的一部分

2.什么叫做线程?

线程:进程内的一个执行流

虚拟内存里面决定了进程能够看到的“资源”,我们将我们的代码分成一块一块的区域,我们不再像以前那样创建进程就将原进程的虚拟地址空间、页表再复制一份,而是只创建PCB指向父进程指向的位置:
【Linux】 由“进程”过渡到“线程” -- 什么是线程(thread)?,Linux基础,linux,运维,服务器,进程,线程
我们首先要知道:一个进程所对应的资源是可以通过虚拟地址空间和页表将部分资源划分给不同的PCB中的,因为我们可以通过虚拟地址空间+页表方式对进程进行资源划分,单个“进程”执行力度,一定要比之前的进程要细

思考:
如果OS真的要专门设计“线程”概念,OS要不要管理这个线程呢?
 肯定是需要的,方法还是:先描述,在组织。在windows中为线程设计专门的数据结构表示线程对象TCB,而在Linux中单纯从线程调度角度,线程和进程有很多的地方是重叠的!所以,我们的Linux工程师,不想给Linux"线程"专门设计对应的数据结构!而是直接复用PCB
 用PCB用来表示Linux内部的"线程"。而对于CPU来说,它并不关心你的PCB是表示进程还是线程,它只关心task_struct(PCB)

线程在进程内部运行,线程在进程的地址空间内运行,拥有该进程的一部分资源!

3.如何看待我们之前学习的进程?

【Linux】 由“进程”过渡到“线程” -- 什么是线程(thread)?,Linux基础,linux,运维,服务器,进程,线程
进程:一堆的PCB + 地址空间 + 页表 + 对应的物理地址

之前的进程:承担系统资源的基本实体,只不过内部只有一个执行流,一个进程内部可以有多个执行流

站在CPU的角度看待task_struct:以前:进程—现在:进程内的一个分支
CPU很笨,它不会区分,它只需要拿来就能用就行。

Linux下统称task_struct:轻量级进程

小总结:

  1. Linux内核中有没有真正意义的线程呢?没有。Linux是用进程PCB来模拟线程的,是一种完全属于自己的一套线程方案
  2. 站在CPU的视角,每一个PCB,都可以称之为叫做轻量级进程
  3. Linux线程是CPU调度的基本单位,而进程是承担分配系统资源的基本单位
  4. 进程用来整体申请资源,线程用来伸手向进程要资源。(比如公司、小组、组员关系,小组向公司申请资金,组员向小组长拿钱)
  5. Linux中没有真正意义的线程
  6. 好处是什么?简单,维护成本大大降低–可靠高效!
    我们使用PCB来模拟线程,那么我们曾经给PCB创建的一整套的数据结构与算法都可以复用。而且线程与进程有很多地方是重叠的,这也给我们重新创建线程方法的编码难度大大提高,更为复杂的代码,带来的就是维护成本的增高

OS只认线程,用户(程序员)也只认线程
Linux无法直接提供创建线程的系统调用接口,而只能给我提供创建轻量级进程的接口


理解线程

我们将
 家庭比作进程
 家庭成员比作线程
 (家庭成员)你的爸爸妈妈努力工作是为了生活更美好,你的爷爷奶奶每天锻炼跳广场舞是为了身体健康,你每天努力学习是为了未来有更好的生活,(家庭)所有人的目的都是为了这个家更美好。家庭与家庭成员关系类比也就是进程与线程的关系


创建线程函数调用

【Linux】 由“进程”过渡到“线程” -- 什么是线程(thread)?,Linux基础,linux,运维,服务器,进程,线程
函数原型:(具体可看下一章 线程控制)

int pthread_create(pthread_t *thread, const pthread_attr_t *attr,
					void *(*start_routine) (void *), void *arg);

创建线程参考:

#include <iostream>
#include <cstdio>
#include <cassert>
#include <pthread.h>
#include <unistd.h>
using namespace std;
// 新线程
void *thread_routine(void *args)
{
    while (true)
    {
        cout << "我是新线程, 我正在运行!" << endl;
        sleep(1);
    }
}

int main()
{
    // typedef unsigned long int pthread_t;
    pthread_t tid;
    int n = pthread_create(&tid, nullptr, thread_routine, (void *)"thread one");
    assert(0 == n);
    (void)n;
    while (true)
    {
        // 地址 -> ?
        cout << "我是主线程, 我正在运行!" << endl;
        sleep(1);
    }
    return 0;
}

直接运行的结果:
【Linux】 由“进程”过渡到“线程” -- 什么是线程(thread)?,Linux基础,linux,运维,服务器,进程,线程
错误:对“pthread create”的未定义引用
原因:这个函数并不是OS提供给我们的系统调用,Linux没有真正意义上的线程,只有轻量级进程,所以Linux只能提供轻量级进程的接口,无法给我们直接创建线程。而这个函数是第三方库提供给我们的,不是语言提供的也不是OS提供的,这个库是:

Compile and link with -pthread.

当然这个库大概率是在系统之中已经有的,为了使用这个第三方库,我们编译时需要找到这个库 -lpthread

g++ -o mythread mythread.cc -lpthread -std=c++11

【Linux】 由“进程”过渡到“线程” -- 什么是线程(thread)?,Linux基础,linux,运维,服务器,进程,线程
【Linux】 由“进程”过渡到“线程” -- 什么是线程(thread)?,Linux基础,linux,运维,服务器,进程,线程

代码执行结果:
【Linux】 由“进程”过渡到“线程” -- 什么是线程(thread)?,Linux基础,linux,运维,服务器,进程,线程
很明显有两个执行流在一起运行,但是:
【Linux】 由“进程”过渡到“线程” -- 什么是线程(thread)?,Linux基础,linux,运维,服务器,进程,线程
【Linux】 由“进程”过渡到“线程” -- 什么是线程(thread)?,Linux基础,linux,运维,服务器,进程,线程
如何看到这两个执行流信息呢?

ps -aL

【Linux】 由“进程”过渡到“线程” -- 什么是线程(thread)?,Linux基础,linux,运维,服务器,进程,线程
【Linux】 由“进程”过渡到“线程” -- 什么是线程(thread)?,Linux基础,linux,运维,服务器,进程,线程
LWP:light weight process 轻量级进程ID
两个线程的PID都是相同的,主线程PIDLWP相同的那个

CPU调度的时候,是以哪一个id为标识符表示特定一个执行流的呢? LWP
当我们只有一个执行流的时候,PID与LWP是相同的,在这种情况下使用PID标识或LWP标识都可以

【Linux】 由“进程”过渡到“线程” -- 什么是线程(thread)?,Linux基础,linux,运维,服务器,进程,线程

1.线程一旦被创建,几乎所有资源都是被线程所共享的

int g_val = 0;
// 新线程
void *thread_routine(void *args)
{
    const char *name = (const char *)args;
    while (true)
    {
        cout << "我是新线程, 我正在运行!" << " : " << g_val++ << " &g_val : " << &g_val << endl;
        sleep(1);
    }
}
int main()
{
    typedef unsigned long int pthread_t;
    pthread_t tid;
    int n = pthread_create(&tid, nullptr, thread_routine, (void *)"thread one");
    assert(0 == n);
    (void)n;
    while (true)
    {
        cout << "我是主线程, 我正在运行!"<< " : " << g_val << " &g_val : " << &g_val << endl;
        sleep(1);
    }
    return 0;
}

【Linux】 由“进程”过渡到“线程” -- 什么是线程(thread)?,Linux基础,linux,运维,服务器,进程,线程

线程也一定要有自己私有的资源,什么资源应该是线程私有的呢?

  1. PCB属性私有
  2. 要有一定私有上下文结构
  3. 每一个线程都要有自己独立的栈结构-

2.与进程之间切换相比,线程的切换

  • 进程:切换页表&&虚拟地址空间&&切换PCB &&上下文切换
  • 线程:切换PCB &&上下文切换
  • 线程切换cache不用太更新,但是进程切换,全部更新
    cache:高速缓冲存储器,比CPU的寄存器慢些,但是比内存块
    软件存在一种属性叫做局部性原理,当前访问的代码和数据那么它相邻的代码和数据也非常容易被访问到。
    【Linux】 由“进程”过渡到“线程” -- 什么是线程(thread)?,Linux基础,linux,运维,服务器,进程,线程
     当多个线程切换时,这些热点数据本来就是被线程所共享的,线程切换时,cache不用被切换。因为这部分数据,线程PCB再怎么切换可能之前缓存的数据还是能用得上,能命中,所以缓存根本不用切换。(热点数据就是经常被访问到的数据)
     如果是进程切换,A进程代码和数据保存一大堆,切换到B进程时,上下文一保存,那么之前cache里的缓存数据都失效,新进程B需要重新加载到cache,切换到旧进程A,又要重新加载,来回切换增加了很多成本与效率。


初识线程总结:

进程 VS 线程
Linux进程是申请资源的基本单位,而线程是进程里面的一个小执行流,是CPU调度的基本单位。下图整个框里面是进程,而线程是绿色的PCB执行流
【Linux】 由“进程”过渡到“线程” -- 什么是线程(thread)?,Linux基础,linux,运维,服务器,进程,线程

线程的优点

  • 创建一个新线程的代价要比创建一个新进程小得多
  • 与进程之间的切换相比,线程之间的切换需要操作系统做的工作要少很多
  • 线程占用的资源要比进程少很多
  • 能充分利用多处理器的可并行数量
  • 在等待慢速I/O操作结束的同时,程序可执行其他的计算任务
  • 计算密集型应用,为了能在多处理器系统上运行,将计算分解到多个线程中实现
  • I/O密集型应用,为了提高性能,将I/O操作重叠。线程可以同时等待不同的I/O操作。

计算密集型应用(CPU,加密,解密,算法等) VS I/O密集型应用(外设,访问磁盘,显示器,网络)

线程的缺点

  • 性能损失
    一个很少被外部事件阻塞的计算密集型线程往往无法与其它线程共享同一个处理器。如果计算密集型线程的数量比可用的处理器多,那么可能会有较大的性能损失,这里的性能损失指的是增加了额外的同步和调度开销,而可用的资源不变。

  • 健壮性降低
    编写多线程需要更全面更深入的考虑,在一个多线程程序里,因时间分配上的细微偏差或者因共享了不该共享的变量而造成不良影响的可能性是很大的,换句话说线程之间是缺乏保护的。
    【Linux】 由“进程”过渡到“线程” -- 什么是线程(thread)?,Linux基础,linux,运维,服务器,进程,线程
     为什么一个线程出问题会影响其余线程?进程信号,信号是整体发给进程的,它会向PID相同的执行流全部写入出错信号。
     线程出异常本身就是进程出异常,比如小组里面的成员删库跑路,公司问责不仅仅要问责这个成员,还需要问责整个小组。一个线程出异常导致整个进程的资源都被释放掉,那么其余的线程赖以生存的资源已经没了,所以也就只能释放

  • 缺乏访问控制
    进程是访问控制的基本粒度,在一个线程中调用某些OS函数会对整个进程造成影响。

  • 编程难度提高
    编写与调试一个多线程程序比单线程程序困难得多

线程异常

  • 单个线程如果出现除零,野指针问题导致线程崩溃,进程也会随着崩溃
  • 线程是进程的执行分支,线程出异常,就类似进程出异常,进而触发信号机制,终止进程,进程终止,该进程内的所有线程也就随即退出

线程用途

  • 合理的使用多线程,能提高CPU密集型程序的执行效率
  • 合理的使用多线程,能提高IO密集型程序的用户体验(如生活中我们一边写代码一边下载开发工具,就是多线程运行的一种表现)

Linux进程VS线程

进程和线程比较:

  • 进程是资源分配的基本单位
  • 线程是调度的基本单位
  • 线程共享进程数据,但也拥有自己的一部分数据,比如:
    1.线程ID
    2.一组寄存器
    3.栈
    4.errno
    5.信号屏蔽字
    6.调度优先级

【Linux】 由“进程”过渡到“线程” -- 什么是线程(thread)?,Linux基础,linux,运维,服务器,进程,线程

线程的共享:
进程的多个线程共享同一地址空间,因此Text Segment、Data Segment都是共享的,如果定义一个函数,在各线程中都可以调用,如果定义一个全局变量,在各线程中都可以访问到,除此之外,各线程还共享以下进程资源和环境:

  • 文件描述符表
  • 每种信号的处理方式(SIG_ IGN、SIG_ DFL或者自定义的信号处理函数)
  • 当前工作目录
  • 用户id和组id

如有错误或者不清楚的地方欢迎私信或者评论指出🚀🚀文章来源地址https://www.toymoban.com/news/detail-607435.html

到了这里,关于【Linux】 由“进程”过渡到“线程” -- 什么是线程(thread)?的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • Linux和windows进程同步与线程同步那些事儿(三): Linux线程同步详解示例

    Linux和windows进程同步与线程同步那些事儿(一) Linux和windows进程同步与线程同步那些事儿(二): windows线程同步详解示例 Linux和windows进程同步与线程同步那些事儿(三): Linux线程同步详解示例 Linux和windows进程同步与线程同步那些事儿(四):windows 下进程同步 Linux和wi

    2024年02月01日
    浏览(25)
  • Linux的进程,协程和线程

    Linux的进程、协程和线程是计算机科学中重要的概念,它们在操作系统和并发编程中发挥着关键的作用。让我们逐个详解这些概念,并讨论它们之间的关系。 进程是操作系统中的一个执行单元,它包含了程序执行所需的所有资源,如内存空间、文件描述符、寄存器等。 进程是

    2024年01月23日
    浏览(31)
  • 【Linux从入门到精通】线程详解(线程与进程区别)

        本篇文章主要 对线程的概念和线程的控制进行了讲解 。其中我们再次对进程概念理解。同时 对比了进程和线程的区别 。希望本篇文章会对你有所帮助。  文章目录 一、线程概念 1、1 什么是线程 1、2 再次理解进程概念 1、3 轻量级进程 二、进程控制 2、1 创建线程 pt

    2024年02月07日
    浏览(30)
  • Linux系列之查看进程线程的方法

    在window系统查看系统进程,我们一般会使用 Ctrl+Shift+Esc 打开系统进程监控页面,但是在Linux系统查看进程一般使用 top 命令或者 ps 命令,但是如果要查看线程怎么查看?其实也可以使用这两个命令,所以本博客总结一下几种方法 ps命令 Linux的ps命令用于查看进程统计信息 常用

    2024年02月07日
    浏览(31)
  • 对于学习Linux进程与线程的感悟

    进程感觉就像一个应用程序一样,比如QQ,火狐浏览器等等,他们之间互不干扰,可以独立运行。线程就像QQ里的各种功能,比如好友列表,显示当前是在线还是离线,会话窗口等等去实现各种功能,进程死掉的话,这些线程也会跟着结束。 经过一段时间的学习,发现线程方

    2024年02月08日
    浏览(26)
  • Linux入门之多线程|线程|进程基本概念及库函数

    目录 一、线程 1.线程的概念 补充知识点:页表 2.线程的优点 3.线程的缺点 4.线程异常 5.线程用途 二、线程与进程的区别与联系 三、关于进程线程的问题 0.posix线程库 1.创建线程 关于pthread_create的后两个参数 1.传入指针 2.传入对象 2.线程终止 3.取消线程 4.线程等待(等待线程

    2024年02月10日
    浏览(25)
  • 【神行百里】python开启多线程(threading)与多进程(multiprocessing)运行

      由于处理数据过多,程序运行很慢,就学习了一下python开启多线程与多进程的方法,虽然最后也没用上,但还是记录总结一下,以备不时之需。   传送门:进程与线程认识,进程与线程通俗理解   简言之, 进程为资源分配的最小单元,线程为程序执行的最小单元

    2024年02月02日
    浏览(32)
  • 【Linux】Linux运维基础

    Linux简介 : Linux是一个开源的操作系统内核,最初由Linus Torvalds创建。它通常与GNU工具一起使用,以创建一个完整的操作系统。 Linux操作系统有许多基于内核的发行版,如Ubuntu、CentOS、Debian等,每个发行版都有其独特的特性和包管理工具。 登录和用户管理 : 使用SSH(Secure

    2024年02月04日
    浏览(36)
  • Linux C/C++ 获取进程号、线程号和设置线程名

    在Linux开发过程中,设计多线程开发时可以将进程和线程的 id 打印出来,方便开发调试和后期查问题使用,同时也包括设置线程名。 Linux中,每个进程有一个pid,类型pid_t,由 getpid() 取得。Linux下的POSIX线程也有一个id,类型 pthread_t,由pthread_self()取得,该id由线程库维护,其

    2024年02月11日
    浏览(29)
  • Linux 查看进程和线程CPU和内存占用情况

    linux 下查看进程内的线程有哪些 首先通过进程名称,假设为SensorDev 找到pid号。 ps -p {pid} -T 可以得到该进程里面运行的各线程的id(表现出来是spid)、对应的线程名称(不超过16字符)、运行时间等; cat /proc/{pid}/status |grep Threads 只能显示线程的个数。 top -p {pid} ,然后按H t

    2024年02月08日
    浏览(47)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包