关于load过高的几种情况

这篇具有很好参考价值的文章主要介绍了关于load过高的几种情况。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

Linux 中 load啥意思
"Load" 在 Linux 系统中通常是指系统的负载情况,也称为系统负荷。它指的是系统正在运行的进程数量以及这些进程对系统资源的使用情况,例如 CPU、内存、磁盘 I/O 等。Linux 系统的负载通常由三个数字表示,分别对应于过去 1 分钟、5 分钟和 15 分钟内的平均值。通常,当这些数字高于 CPU 核心数的 70% 左右时,就可以认为系统的负载较高,需要进一步分析和优化。

Linux PID TID啥意思
在Linux系统中,每个正在运行的进程都有一个唯一的数字标识符,称为进程ID(PID)。PID是一个非负整数,通常在系统启动时自动分配。进程ID的范围通常是从1到32768,但具体取决于系统配置。
在进程内部,还有一种标识符叫做线程ID(TID),它也是一个非负整数,用于标识一个进程内部的线程。每个线程都有一个唯一的TID,但是它们都共享相同的PID,因为它们是同一个进程的不同执行路径。
因此,PID是进程的唯一标识符,而TID是线程的唯一标识符。在Linux中,通过PID和TID可以管理和控制进程和线程的行为。


关于负载过高情况(load)
情况一:CPU高,load高
当CPU高,load也高时,表示系统正在处理大量的任务,但CPU资源不足以处理这些任务,导致任务队列(即进程等待队列)中的进程数目增加,从而导致load增加。这种情况通常被称为CPU过载,是指系统的CPU资源不足以满足当前正在运行的任务需求。
对于这种情况,可以通过以下方法来缓解负载过高的问题:
优化进程或应用程序,尽量减少CPU的占用率。
增加CPU资源,例如增加处理器数量或提高处理器速度。
增加系统内存,以便更多的进程可以在内存中运行,从而减少对CPU的竞争。
调整系统的调度策略,例如增加时间片大小,减少进程的上下文切换等,以优化CPU的利用率。
将任务分配到不同的计算节点,以减少单个节点的负载。
需要注意的是,当CPU过载时,系统的响应时间和处理能力都会受到影响。因此,及时采取措施来缓解负载过高的问题是非常重要的。

找占用最高的PID 通过PID找最高线程TID 若是java程序,打印线程堆栈信息,
1.top查看cpu最高的进程PID(进程号)
2.top -Hp PID 查看占用CPU最高的TID
3.若是java程序,jstack打印线程堆栈信息
查看Java进程的ID:jps
查看java线程堆栈信息:jstack PID进程号
将信息写入到指定文件:jstack  PID进程号> stacktrace.txt
jstack命令会暂停Java进程的所有线程,以便获取线程堆栈信息 避免在高峰期进行操作。
4.printf %x tid 打印最消耗CPU线程的十六进制。printf是一个用于格式化输出的命令。%x是一种格式控制字符,用于指定输出格式为十六进制数。线程的ID(即TID)

vmstat 查看系统维度的CPU负载
top 查看进程维度的CPU负载

vmstat -n 1  结果一秒刷新一秒 (使用vmstat查看系统维度的CPU负载)
r:系统中CPU等待处理的线程,由于CPU每次只能处理一个线程,所以该数值越大系统运行越慢
b:进程阻塞
us:用户CPU时间,
sy:系统CPU时间
wa:消耗的CPU时间百分比,
id:处于空闲状态的CPU时间百分比
cpu负载重原因:
r大于4且id少于40,等待处理的线程过大
bi,bo长期不等0,表示内存不足
disk进程不等于0,b大于三,表示io性能差

使用top 查看进程维度的CPU负载
top 查看CPU,内存等资源的使用情况
界面第三行显示CPU资源的总体使用情况,下方显示各个进程的资源占用情况
直接在界面输入大写字母P,使用率排序监控结果,定位CPU占用CPU较高的进程。
根据系统日志和程序自身相关日志,对相应进程做进一步排查分析,判断占用过高CPU的原因。


Linux上进程的五种状态
R (TASK_RUNNING):可执行状态,只有在该状态的进程才可能在CPU上运行。而同一时刻可能有多个进程处于可执行状态。
S (TASK_INTERRUPTIBLE):可中断的睡眠状态,处于这个状态的进程因为等待某某事件的发生(比如等待socket连接、等待信号量),而被挂起。
D (TASK_UNINTERRUPTIBLE):不可中断的睡眠状态,进程处于睡眠状态,但是此刻进程是不可中断的。TASK_UNINTERRUPTIBLE状态存在的意义就在于,内核的某些处理流程是不能被打断的。
T (TASK_STOPPED or TASK_TRACED):暂停状态或跟踪状态。
Z (TASK_DEAD - EXIT_ZOMBIE):退出状态,进程成为僵尸进程。进程已终止,但进程描述还在,直到父进程调用wait4()系统调用后释放。

情况二  CPU利用率低、Load负载高
等待磁盘I/O完成的进程过多,导致进程队列长度过大,但CPU运行的进程很少,体现负载过大,cpu使用率低。
说明处于等待状态的任务很多,负载越高,代表可能很多僵死的进程。通常这种情况是IO密集型的任务,大量任务在请求相同的IO,导致任务队列堆积。
I/O:CPU等待IO,磁盘IO,网络IO
top 查看%wa(cpu等待IO时间)
iostat -d -x -m 1 10 查看磁盘IO情况(yum install -y sysstat)
sar -n DEV 1 10 查看网络IO
查看占用IO的程序:
ps -e -L h o state,cmd | awk '{if($1=="R"||$1=="D"){print $0}}' | sort | uniq -c | sort | uniq -c | sort -k 1nr

top观察,CPU很空闲,但是load average非常高。
cpu高而负载高,等待磁盘I/O完成的进程过多,导致队列长度过大,这样体现到负载过大了,实际此时CPU被分配去执行别的任务或空闲
情况一:磁盘读写请求过多导致大量I/O等待
情况二:MySQL中存在没有索引的语句或存在死锁等情况
情况三:外接硬盘故障,常见有挂了NFS,但是NFS server 故障

处理办法
load average 是对 CPU 负载的评估,其值越高,说明其任务队列越长,处于等待执行的任务越多。
出现此种情况时,可能是由于僵尸进程导致的。可以通过指令ps -axjf查看是否存在 D 状态进程。
D 状态是指不可中断的睡眠状态。该状态的进程无法被 kill,也无法自行退出。只能通过恢复其依赖的资源或者重启系统来解决。


cpu利用率   和cpu负载区别

cpu利用率 使用率占用率区别他们是一样的吗
虽然这些指标都涉及到CPU资源的利用情况,但它们的计算方法和指向的对象有所不同。因此,在实际使用中,需要根据具体的情况选择合适的指标来评估CPU的利用情况。

什么是时间片?
现在基本的操作系统都是多任务操作系统,即可以同时运行多个程序。一个cpu内核在多个进程之间轮流切换,每个进程占用CPU一小段很短的时间(5ms-800ms),用户基本觉察不到,这里的一小段时间就是时间片。


CPU使用率?CPU利用率?和CPU占用率 ? CPU负载?
CPU使用率就是程序对CPU的占用情况,即CPU使用率=CPU时间片被程序使用的总时间/CPU的总时间。即全部进程的占用时间/(总占用时间+空闲时间)
CPU利用率显示的是程序在运行期间实时占用的CPU百分比
CPU占用率分为用户态CPU使用率和系统态CPU使用率。
用户态CPU使用率:执行应用程序代码的时间占总CPU时间的百分比。
系统态CPU使用率是指应用执行操作系统调用的时间占总CPU时间的百分比。
系统态CPU使用率是指应用执行操作系统调用的时间占总CPU时间的百分比。
系统态的CPU使用率高意味着共享资源有竞争或者I/O设备之间有大量的交互。
CPU负载显示的是一段时间内正在使用和等待使用CPU的平均任务数。这里的一段时间指的是CPU一个总时间(运行加空闲)
CPU利用率是CPU实时使用情况,CPU负载是CPU当前以及未来一段时间的使用情况
无论CPU的利用率是高是低,后面有多少任务在排队(CPU负载)无必然关系
CPU利用率可以是百分百,这时候CPU负载不一定只是一 根据总核数在一到总核数之间为正常

uptime 和w 都可以查看CPU平均负载,top也可,top还能看到CPU负载总体使用率以及各个进程占用CPU的比例。

 可以查看物理CPU个数
cat /proc/cpuinfo| grep “physical id”| sort | uniq| wc -l 

查看物理CPU的核的个数
cat /proc/cpuinfo| grep “cpu cores” | uniq

查看逻辑CPU的个数
cat /proc/cpuinfo| grep “processor”| wc -l

情况三 负载低利用率高
这表示CPU的任务并不多,但是任务执行的时间很长,大概率就是你写的代码本身有问题,通常是计算密集型任务,生成了大量耗时短的计算任务。

直接top命令找到CPU使用率最高的进程(记录PID号),如果代码没有问题,那么过段时间CPU使用率就会下降的
找该进程的线程:top -Hp pid (最靠前的几个占用最高 )
线程PIDh转16进制,printf “0x%x\n”PID号
通过16进制的PID号找有问题的代码
jstack 进程的PID | grep ‘线程16进制代码’ -C5 --color

网络协议:
应用层:
http协议格式
请求行、请求头、空一行、请求体
请求行包括:请求方法、统一资源定位符(URL)、http协议及版本
响应报文格式:状态行、响应头、空一行、响应体
状态行包括:协议及版本、状态码、状态码解释

http和https的区别文章来源地址https://www.toymoban.com/news/detail-691783.html

到了这里,关于关于load过高的几种情况的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • Vmmem进程(WSL)占用CPU或内存资源过高的解决办法

            有没有一瞬间,在开启docker或打开虚拟机时,内存瞬间飚增,进行查看进程消耗是一个Vmmem的进程在作祟,那么Vmmem是什么呢,又如何进行限制呢!         Vmmem: 是一个系统合成的虚拟进程,用于表示虚拟机小航的内存和CPU资源。换句话说,您看到的Vmmem消耗

    2024年02月13日
    浏览(64)
  • Linux 查看内存使用情况的几种方法

    *以下内容为本人的学习笔记,如需要转载,请声明原文链接 微信公众号「ENG八戒」https://mp.weixin.qq.com/s/27UaVm5_FMhCnxB88pc0QA 在运行 Linux 系统的过程中为了让电脑或者服务器以最佳水平运行,常常需要监控内存统计信息。 那么今天我们就来看看有哪些方法可以访问所有相关信息

    2023年04月20日
    浏览(33)
  • 【linux】Linux 查看内存使用情况的几种方法汇总

    Linux 查看内存使用情况的几种方法包括使用 free 命令、top 命令、htop 命令、vmstat 命令和/proc/meminfo 文件。这些方法可以帮助用户了解系统内存的使用情况,包括总内存、已用内存、空闲内存、缓存和交换分区等信息。 在运行 Linux 系统的过程中为了让电脑或者服务器以最佳水

    2024年02月04日
    浏览(33)
  • 【Linux】cache不被释放的几种情况

    在Linux系统中,我们经常用free命令来查看系统内存的使用状态。在一个RHEL6的系统上,free命令的显示内容大概是这样一个状态: 这里的默认显示单位是kb,我的服务器是128G内存,所以数字显得比较大。这个命令几乎是每一个使用过Linux的人必会的命令,但越是这样的命令,似

    2024年02月10日
    浏览(32)
  • 分享Linux 查看内存使用情况的几种方法

    Linux 查看内存使用情况的几种方法包括使用 free 命令、top 命令、htop 命令、vmstat 命令和/proc/meminfo 文件。这些方法可以帮助用户了解系统内存的使用情况,包括总内存、已用内存、空闲内存、缓存和交换分区等信息。 在运行 Linux 系统的过程中为了让电脑或者服务器以最

    2024年02月04日
    浏览(37)
  • Linux SSH失效的几种情况以及排查方法

    公司有个项目是用三台Linux服务器的,在第一台服务器上使用shell脚本同时部署至三台服务器 突然最近有个生产环境SSH不好用了,经过仔细排查才得以解决 基本上排查完这几种情况就能发现问题了

    2024年02月12日
    浏览(34)
  • 一文教会你Linux 查看内存使用情况的几种方法

    在运行 Linux 系统的过程中为了让电脑或者服务器以最佳水平运行,常常需要监控内存统计信息。 那么今天我们就来看看有哪些方法可以访问所有相关信息并帮助管理员监控内存统计信息。 查看或者获取 Linux 中的内存使用情况既可以通过命令的方式,也可以通过桌面端的GU

    2024年02月10日
    浏览(36)
  • iPortal内置Elasticsearch启动失败的几种情况——Linux

    作者:yx 在Linux环境启动iPortal后有时会出现搜索异常的情况,如下截图,这是因为Elasticsearch(以下简称“ES”)没启动成功导致的,支持过程中常遇到有三种情况导致ES启动失败的原因,一起来看看吧! 从帮助文档可以得知,启动内置的搜索服务时相关端口有这些: 如果使用

    2024年01月16日
    浏览(37)
  • 时间状语前不用介词的几种情况

    1. today,yesterday, tomorrow,tonight, yesterday/tomorrow morning(evening, afternoon),today week (下周的今天) there is a football game tomorrow morning. 2. 表示时间的短语里面有next, last, one, this,these,those,every,each,some,any,all等单词,介词应该省略。 i will see you next week. you can come any days you want. 你哪天来都可以

    2023年04月09日
    浏览(92)
  • 避坑:.NET内存泄露的几种情况

    内存“泄露”是开发中常见的问题之一,它会导致应用程序占用越来越多的内存资源,最终可能导致系统性能下降甚至崩溃。软件开发者需要了解在程序中出现内存泄露的情况,以避免软件出现该的问题。 什么是内存“泄露”? 内存泄露是申请了内存空间的变量一直在占用

    2024年02月11日
    浏览(34)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包