N5105 Promox VE 虚拟机频繁死机问题处理

这篇具有很好参考价值的文章主要介绍了N5105 Promox VE 虚拟机频繁死机问题处理。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

N5105 Promox VE 虚拟机频繁死机问题处理

使用 N5105 作为 HomeLab 的服务器;之前安装的 ESXi,使用 Ubuntu 22 的时候经常会出现 Ubuntu CPU 占用达到100%,然后死机;但是其他的虚拟机都没有问题,因为对 Linux 并不熟,查看了 ESXi 和 Ubuntu 日志并没有异常;后面安装黑群晖一直失败,因此换到了 Proxmox VE

换到 PVE 后依然存在同样的问题,以为是服务的问题,于是给 Docker 容器添加了资源限制,无效后迁移到了 CentOS 部署,发现还是同样的问题;并且越来越频繁,从一天一次变成了几小时一次,几乎无法使用

猜测会不会是硬件问题,一番搜索发现在 N5105 上居然是个普遍的问题

问题

这个问题于 2022-08-04 在 Proxmox 的问题反馈中提交:Bug 4188 - VMs freeze on Intel N5105 CPU,描述中"到运行Intel N5105 CPU的一些用户注意到在Proxmox上运行的虚拟机会冻结,并记录了各种错误。虚拟机会冻结,控制台无法输入,CPU利用率达到最大值,直到强制重启虚拟机",现象和我遇到的是一样的,说明该现象是通病;

N5105 Promox VE 虚拟机频繁死机问题处理

2022-9-13 在帖子 Opt-in Linux 5.19 Kernel for Proxmox VE 7.x available 中,PVE员工宣布将 PVE 的内核升级到 5.19版本,在 Bug 反馈到讨论中有不少人确认有效

N5105 Promox VE 虚拟机频繁死机问题处理

这个问题在 2022-12-06 状态变更为 ‘FIX PACKAGED’;在 2022-12-14,PVE员工宣布支持将内核升级到 6.1

N5105 Promox VE 虚拟机频繁死机问题处理

在 Bug 反馈的最后几条评论中,反馈死机的问题在升级 5.19 或 6.1 的内核后确实减少了,但是依然可能出现

N5105 Promox VE 虚拟机频繁死机问题处理

修复

按照 PVE 的回复,需要将 Linux 内核升级到 5.19 版本

修改订阅源

  • 关闭企业订阅源

该订阅源是付费版本的订阅源,提供例如集群管理、备份和恢复等功能,未购买时无法使用,因此需要将其移除;为了保险将文件重命名为 backup

mv /etc/apt/sources.list.d/pve-enterprise.list /etc/apt/sources.list.d/pve-enterprise.list.backup
  • 添加非订阅源

“pve-no-subscription” 是 Proxmox VE 软件包源名称中的一个参数,代表这个软件包源提供的是免费版本的 Proxmox VE 软件包, “bullseye” 是 Debian GNU/Linux 操作系统的一个版本号,是该操作系统的第11个主要发行版

echo 'deb http://download.proxmox.com/debian/pve bullseye pve-no-subscription' >> /etc/apt/sources.list.d/pve-no-subscription.list
  • 添加 Debian non-free 源

添加 non-free 是为了更新 Microcode,默认的软件源不包含 non-free

tee /etc/apt/sources.list.d/debian-non-free.list > /dev/null <<EOF
deb http://deb.debian.org/debian bullseye main contrib non-free
deb http://security.debian.org/debian-security bullseye-security main contrib non-free
deb http://deb.debian.org/debian bullseye-updates main contrib non-free
EOF

在Debian操作系统中,软件包分为三个部分:main,contrib和non-free。其中,main 和 contrib 部分的软件都是自由软件,它们遵循自由软件定义(Free Software Definition),可以自由地使用、修改、复制和重新分发。

而 non-free 部分则包含了一些不符合自由软件定义的软件,例如某些专有硬件驱动程序、特定格式的音频和视频编码器等。这些软件可能有一些限制,例如不允许用户对其进行修改或重新分发。因此,这些软件在Debian社区中并不被认为是自由软件。

deb http://deb.debian.org/debian bullseye main contrib non-free 这是Debian操作系统的主要软件源,其中包含了Debian操作系统的核心软件包和一些第三方软件包,其中contrib和non-free分别代表自由度不同的软件包。

deb http://security.debian.org/debian-security bullseye-security main contrib non-free 这个源提供了Debian操作系统安全更新的软件包。这些软件包通常修复已知的漏洞和安全问题。

deb http://deb.debian.org/debian bullseye-updates main contrib non-free 这个源提供了针对Debian操作系统稳定版本的非安全更新的软件包。这些软件包通常修复错误并提供新功能。

更新 5.19 版本的内核

更新软件后安装 5.19 版本的内核

apt update -y
apt install pve-kernel-5.19 -y

安装 Intel CPU microcode

处理器微码([Microcode] )。

intel-microcode 作用是为英特尔处理器提供微码(microcode)更新。微码是一组指令,类似于处理器固件,可以在处理器上执行,以改变其行为或修复错误,内核能够在不需要通过BIOS更新的情况下更新处理器的固件。微码更新保存在易失性存储器中,因此BIOS/UEFI或内核会在每次启动时更新微码

intel-microcode 的更新通常由操作系统或设备厂商提供,旨在提高处理器的性能、稳定性和安全性。

apt update -y
apt install intel-microcode -y

重启

等待更新完成后重启即可

reboot

重启后查看 Linux 内核版本,已经更新到了 5.19.17-2-pve

uname -r

5.19.17-2-pve

查看 Microcode 版本,可以看到更新到 0x24000023 版本,发布日期是 2022-02-19文章来源地址https://www.toymoban.com/news/detail-440583.html

dmesg | grep microcode

[    0.000000] microcode: microcode updated early to revision 0x24000023, date = 2022-02-19
[    0.203334] SRBDS: Vulnerable: No microcode
[    1.337062] microcode: sig=0x906c0, pf=0x1, revision=0x24000023
[    1.337093] microcode: Microcode Update Driver: v2.2.

到了这里,关于N5105 Promox VE 虚拟机频繁死机问题处理的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • 关于vmware中的某个虚拟机死机且无法关机问题的快速解决办法

    前情概要:公司某台服务器上采用的是vmware的方案进行部署的,在vmware中部署了多台虚拟机,某天其中一台虚拟机突然卡死(事后经检查是由于运行的python程序线程调用错误,导致CPU和内存占满,进而导致服务器卡死)且无法关机或其他任何操作(如下图)。因为无法重启物

    2024年02月15日
    浏览(57)
  • Hbase regionserver频繁突然挂掉的问题处理

    系统:linux centos7.4 Hbase:2.1.0-cdh6.3.2 (CDH版本) 1、应用方报错: 2、查看cdh页面 发现HBase的regionserver有4个节点,全部挂掉 登录机器查看日志,发现两个明显错误和一个奇怪的情况: 1、snapshot超时 2、内存频繁超过高水位watermark 3、奇怪的情况:没有正常关闭的日志 每个节点

    2023年04月10日
    浏览(31)
  • Proxmox VE与常见的虚拟化平台比较

    Proxmox VE的简要介绍 根据Proxmox VE的官网介绍,Proxmox Virtual Environment(简称Prxomox VE或PVE)由位于奥地利维也纳的Proxmox Server Solutions公司开发和维护。Proxmox VE软件和社区支持都是免费的,企业用户则可以通过订阅制来获得付费商业支持。 根据Proxmox VE的官网介绍,Proxmox VE是一个

    2023年04月12日
    浏览(94)
  • Proxmox VE 8 发布 - 开源虚拟化管理平台

    Proxmox VE 8 发布 - 开源虚拟化管理平台 请访问原文链接:https://sysin.org/blog/proxmox-ve-8/,查看最新版。原创作品,转载请保留出处。 作者主页:sysin.org 宣布 Proxmox 虚拟环境的主要版本 8.0!它基于出色的 Debian 12 “Bookworm”,但使用更新的 Linux 内核 6.2,QEMU 8.0.2,LXC 5.0.2 和O pen

    2024年02月11日
    浏览(47)
  • Ubuntu Desktop 死机处理

    当 Ubuntu Desktop 死机时,除了长按电源键重启,还可以使用如下两种方式处理。 使用 ctrl + alt + F3~F6: 切换到其他 tty 命令行。 执行 top 命令查看资源占用最多的进程,然后使用 kill 命令杀死进程即可。 然后使用 ctrl + alt + F1 切回到桌面。 buiser 组合键: Ctrl+Alt + Sysrq/PrtSc + REIS

    2024年02月04日
    浏览(30)
  • 配置Proxmox VE8.1开出的虚拟机网络踩坑日记

    机房里面有两个物理机。物理机A配公网IP106.58.222.100;物理机BIPIM设置为静态的192.168.1.33。 为了节约IP,所以只给物理机A配网IP,通过物理机A中开出虚拟机,使用局域网访问物理机B的IPIM,于是给物理机A是额外添加了一个外接网卡(本来是一个物理网卡)。现在硬件齐了,那

    2024年01月24日
    浏览(65)
  • 【虚拟机】xshell连接虚拟机频繁显示连接超时的解决方式(之一):检查ip

    在确认虚拟机可以联网的前提下(在虚拟机终端内输入ifconfig后可以查看到虚拟机ip即是可以联网): 如果出现如下重复请求超时的情况,可以考虑检查虚拟机的ip; 先在Windows内使用win+r,输入cmd后进入命令窗口,在命令窗口中输入ipconfig后回车键,往下移动可找到虚拟机vm

    2024年02月14日
    浏览(44)
  • MCU死机定位问题

    将两篇文章合并了,方便阅读 2023/08/31 Ozone 是 Segger 公司开发的一个调试工具,用于 Trace 程序的运行。 OZONE是用于嵌入式系统调试的开源调试器。它提供了一套工具和界面,用于帮助开发人员调试嵌入式设备上的软件和硬件问题。OZONE主要用于ARM Cortex-M微控制器的调试,但也

    2024年02月10日
    浏览(32)
  • 单片机程序死机问题分析

    关于硬件: 经验一:重视墨菲定理,不要忽略细节,保持敏感性! 经验二:异常死机,先查硬件。 经验三:电源!时钟!复位! (1)重视墨菲定理,不要忽略细节,保持敏感性! 产品研发中如果出现异常,请不要忽略掉。要相信墨菲定理。疫情期间由于封控,设计的产品在

    2024年02月06日
    浏览(35)
  • 手机定屏死机问题操作指南

    和你一起终身学 习,这里是程序员Android 经典好文推荐,通过阅读本文,您将收获以下知识点: 一、定屏死机问题抓取 Log 要求 二、 复现定屏死机问题后做什么 三、检查adb是否可连的方法 四、连接adb 抓取以下Log 五、如果adb不可连,执行下面操作 六、黑屏 dump 抓取方案 1.使

    2024年02月17日
    浏览(30)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包