ROG 冰刃4 在 Ubuntu 環境下安裝NVIDIA驅動
機器配置

更新
系統安裝好以后直接插網線,或者找個不需要安裝驅動的無線網卡聯網,然后在配好軟體源之后開始更新系統,參照https://www.cnblogs.com/harrypotterjackson/p/11846222.html
sudo apt update && sudo apt upgrade
sudo apt-get install git fakeroot build-essential ncurses-dev xz-utils libssl-dev bc flex libelf-dev bison dkms
解壓
去Linux官網下載最r新內核,比如 linux-5.9.4.tar.xz,解壓后進入目錄
tar -xvf linux-5.9.4.tar.xz
cd linux-5.9.4
配置內核
注意.config前面有個空格
cp /boot/config-$(uname -r) .config
編譯和安裝
一行一行執行,-j后的數字表示使用多核并行加速編譯,
make -j10
sudo make modules_install
sudo make install
啟動內核作為引導
最后的數字(5.9.4)為新下載的內核版本號
sudo update-initramfs -c -k 5.9.4
更新grub
sudo update-grub
重啟
reboot
重啟之后可在啟動界面選擇內核進入系統,若看不到選擇界面,請參照https://www.cnblogs.com/harrypotterjackson/p/11846222.html
進入系統后可通過 uname -r 查看內核版本
![]()
接下來是坑
如果使用nvidia官網下載run檔案的方法來安裝GPU驅動,并且在安裝程序最后有關xconfig的配置時選擇了yes(默認是no),那么很有可能進入系統后是黑屏(伴隨一聲喇叭警報表示出錯)且無法進入桌面的,之后耗費了我整整一天的錯誤排查,由于本人水平較菜,只能使用暴力破解的解決思路了,嘗試的方案包括:使用不同的驅動安裝方式,嘗試不同的老版驅動、使用老板內核、使用不同的blacklist.conf配置,nouveau禁用,各種姿勢開關lightdm,修改/etc/default/grub配置,查看Xorg.0.log ,使用nvidia-bug-report.sh,以及以上各種操作的排列組合,均以失敗告終,
直接放答案吧
從官方support得知,似乎不建議從官方的網站下載run檔案來安裝!

先卸載吧
使用uninstall卸載,NVIDIA-Linux-x86_64-450.80.02.run請替換成自己的run檔案名,
sudo ./NVIDIA-Linux-x86_64-450.80.02.run --uninstall
或者使用apt卸載,如果有安裝cuda,可以順便一起也卸載了,圖個干凈清爽,然后關機,做個護發+護眼+護膚的護理三連后睡覺不香嗎?
sudo apt-get remove --purge "nvidia*"
sudo apt autoremove
言歸正傳
先檢查 blacklist,把找到的檔案里和 blacklist nvidia 有關的行都注釋掉,沒有找到就不用管,并且如果存在 /lib/modprobe.d/blacklist-nvidia.conf 和 /etc/modprobe.d/blacklist-nvidia-nouveau.conf 就也把這兩貨刪了,
grep 'blacklist nvidia' /etc/modprobe.d/* /lib/modprobe.d/*
完事后執行命令并重啟,
sudo update-initramfs -u
reboot
船新安裝
添加NVIDIA官方庫,更新一波,
sudo add-apt-repository ppa:graphics-drivers/ppa
sudo apt-get update
之后讓系統來推薦驅動版本,我的是推薦nvidia-driver-455,應該是最新的版本,

直接安裝,
sudo apt install nvidia-driver-455
順便可以把nvidia-settings和nvidia-prime也裝了,如果沒有自動裝的話,
sudo apt install nvidia-settings nvidia-prime
搞完重啟,
reboot
如果還是黑屏,或者沒黑屏但登陸后執行nvidia-smi報錯,可以使用 prime-select query 先看下當前加載的gpu是獨顯還是集顯,
![]()
回傳nvidia表示是獨顯,那么nvidia-smi報錯代表還是哪里有問題,
關鍵來了
以下是本人的修改方法,可以嘗試,但不保證能解決,
在操作之前,建議把bios里的secure boot禁用,如果問題依然存在,則執行如下步驟,
備份
備份/etc/X11/xorg.conf
sudo cp /etc/X11/xorg.conf /etc/X11/xorg.conf.bk
查看GPU總線ID,
lspci |grep -E "VGA|3D"

從上圖中可以看到第二塊為NVIDIA GPU,記住前面的數字 01:00.0
打開 /etc/X11/xorg.conf,找到 Device section,改成如下圖所示,其中BusId 后面的 "PCI:1:0:0" 代表上面的 01:00.0

改完后保存重啟應該就大功告成啦,
進入系統后查看系統引數界面查看是否顯示獨顯,不是的話可以通過 prime-select nvidia 切換一下再重啟,正確安裝后如下圖所示,左邊是 nvidia-setting,可以切換GPU(需要重啟),右邊顯示GPU為獨顯,cuda安裝什么的以后看情況再說吧,

轉載請註明出處,本文鏈接:https://www.uj5u.com/qita/208015.html
標籤:AI
上一篇:Centos7 rsync+crontab 定時備份
下一篇:再說linux命令列的管道
