最近装了一台新电脑,具体配置为13600KF+4070SUPER,带两块1tb固态硬盘。我打算一块装WIN11用于娱乐,一块装Ubuntu用于学习SLAM。在装WIN11时没有遇到什么问题,B站上教程也很多,这里贴一个我看的教程。装机不求人之:史上最全传说级装系统教程,零基础新手一站式WIN10系统安装攻略。内含系统激活、驱动安装、BIOS基础调试及基础烤机稳定性压力测试。_哔哩哔哩_bilibili
但在装Ubuntu系统时遇到了很多问题,记录如下:
1.ubuntu系统选择
最初,我打算装最新的22.04版本,结果装完发现ROS1不支持,安装比较麻烦,于是转向算法使用的18.04,在这个版本上遇到的问题是驱动比较难装。在初次进入系统时,网卡、显卡驱动全部没有,都需要自己手动安装,于是也放弃了这个版本。最终选择了折中的20.04.
2.Nvidia显卡驱动安装
在安装20.04版本后,进入系统发现分辨率是1024*768,且无法修改,原因大概是显卡驱动的问题。由于系统默认的驱动是开源的nouveau,可能不适配新的显卡,还是要安装NVIDIA的显卡驱动。
很多教程说在“软件与更新”中的“附加驱动”中可以找到显卡的驱动,但我的显卡可能由于比较新的缘故(写作时刚发售一周)无法找到合适的驱动。可以从官网下载适用于Linux的驱动。参考的教程有
【超详细】【ubunbu 22.04】 手把手教你安装nvidia驱动,有手就行,隔壁家的老太太都能安装_ubuntu安装nvidia显卡驱动-CSDN博客
在装完显卡驱动后就可以正常调节分辨率了,命令行输入
nvidia-smi
即可看到
3.系统卡死
在装好驱动后,系统不定时发生卡死,主要表现为画面卡住,鼠标不能移动,键盘键入没有反应等。只能按ubuntu系统突然卡死或者完全死机怎么办_ubuntu motrix 死机-CSDN博客中的方法二进行重启。
命令行键入
journalctl -p err > ~/err.log
输出错误日志,发现有两类错误
错误一
1月 24 09:56:29 chiyb-Default-string kernel: ACPI BIOS Error (bug): Failure creating named object [\_SB.PC00.PEG1.PEGP._DSM.USRG], AE_ALREADY_EXISTS (20210730/dsfield-184)
1月 24 09:56:29 chiyb-Default-string kernel: ACPI Error: AE_ALREADY_EXISTS, CreateBufferField failure (20210730/dswload2-477)
1月 24 09:56:29 chiyb-Default-string kernel: ACPI Error: Aborting method \_SB.PC00.PEG1.PEGP._DSM due to previous error (AE_ALREADY_EXISTS) (20210730/psparse-529)
根据网上查到的结果,这个错误似乎与主板BIOS有关系,并且只在卡死后重启时出现,应该不是产生卡死的原因。且我使用的是铭瑄的主板,支持比较差,主板BIOS估计也不会针对Linux进行改进,这里先搁置。
错误二
1月 24 11:17:50 chiyb-Default-string kernel: pcieport 0000:00:01.0: PCIe Bus Error: severity=Uncorrected (Non-Fatal), type=Transaction Layer, (Requester ID)
1月 24 11:17:50 chiyb-Default-string kernel: pcieport 0000:00:01.0: device [8086:a70d] error status/mask=00100000/00010000
1月 24 11:17:50 chiyb-Default-string kernel: pcieport 0000:00:01.0: [20] UnsupReq (First)
1月 24 11:17:50 chiyb-Default-string kernel: pcieport 0000:00:01.0: AER: TLP Header: 34000000 01000010 00000000 00000000
这部分应该是卡死的罪魁祸首。是PCIe出了问题,但是是哪里出了问题呢?相似的问题网上有不少
①认为可能是内核问题
Pcie bus error severity=uncorrected (non-fatal) type=transaction layer (requester id) - Linux - NVIDIA Developer Forums
解决方法:更新内核
Ubuntu系统直接坏了,不得已重新装了系统
②认为可能是显卡驱动问题
Kernel: pcieport 0000:00:01.0: AER: device recovery failed, with RTX 4090 only - Graphics / Linux / Linux - NVIDIA Developer Forums
看了一遍,这是和我所出现问题最像的一个,根据端口号0000:00:01.0可以判断出是显卡与总线之间出了问题
从系统日志中发现了如下报错
Jan 24 23:18:43 chiyb-Default-string kernel: [ 237.645673] NVRM: GPU at PCI:0000:01:00: GPU-afec229e-4bba-31cd-3299-b4a17935010d
Jan 24 23:18:43 chiyb-Default-string kernel: [ 237.645680] NVRM: Xid (PCI:0000:01:00): 79, pid='<unknown>', name=<unknown>, GPU has fallen off the bus.
Jan 24 23:18:43 chiyb-Default-string kernel: [ 237.645683] NVRM: GPU 0000:01:00.0: GPU has fallen off the bus.
Jan 24 23:18:43 chiyb-Default-string kernel: [ 237.645688] NVRM: A GPU crash dump has been created. If possible, please run
Jan 24 23:18:43 chiyb-Default-string kernel: [ 237.645688] NVRM: nvidia-bug-report.sh as root to collect this data before
Jan 24 23:18:43 chiyb-Default-string kernel: [ 237.645688] NVRM: the NVIDIA kernel module is unloaded.
这就是造成上面总线报错的原因。显卡总是会掉出总线,设置持续模式也无效。看了比较多论坛的内容,Nvidia论坛的解答人员倾向于大部分是硬件问题(电源供电不足、显卡接口氧化、使用线缆错误等)。但我在Windows11中使用软件对显卡与CPU进行双烤测试,没有发现供电问题。显卡接口也使用最新的12VHPWR的单独供电,应该不是硬件上的问题。
我把目光转向显卡驱动,发现了一种新的显卡驱动的安装方式,如下所示:
ubantu 22.04.2系统安装驱动以及cuda - 知乎
最初我想在原有驱动的基础上直接覆盖安装,结果直接报错,原有的驱动也无法使用了,又重装了一遍系统。
在新系统上我没有禁用nouveau,也没有进入命令行。在进行基本更新后直接使用上述方法,找到与官网对应的版本号(535.154.05)进行安装,完成后使用reboot重启。但我不知道这种方法如何更新驱动。如果读者能够不吝赐教那就再好不过了。
//首先更新软件源并安装必需的工具
sudo apt update
sudo spt install g++
sudo apt install gcc
sudo apt install make
到发帖为止,还没有出现卡死的情况,一旦出现,我再更新。
---------------------------------------------------------------------------------------------------------------------------- 第二天又出现了掉显卡的问题,说明还没有解决,不知道咋办了。。。
-----------------------------------------------------------------------文章来源:https://www.toymoban.com/news/detail-836874.html
经过两天的观察,我发现虽然使用直接安装也有可能会出现掉显卡的问题,但出现的频率明显降低。两天的使用仅出现了一次,我认为这个方法应该比使用命令行安装更稳定。文章来源地址https://www.toymoban.com/news/detail-836874.html
到了这里,关于关于新电脑装Ubuntu时遇到的问题的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!