前言
今天查看服務器一個使用了pytorch的專案升級后突然出錯,報錯的全內容由于標題限制,下面我發出來,
builtins.RuntimeError: CUDA unknown error - this may be due to an incorrectly set up environment, e.g. changing env variable CUDA_VISIBLE_DEVICES after program start. Setting the available devices to be zero.
報錯截圖

后來查閱了一些資料,下面說下幾種解決方法,
解決方法
方案1:添加環境變數
由于我是docker容器啟動專案,所以進入容器后安裝完vim,然后在~/.bashrc最后添加了一下內容,
export CUDA_VISIBLE_DEVICES=0
由于在構建容器的時候選的顯卡編號為0,所以上面我配置的編號為0,
重啟容器后檢查$ CUDA_VISIBLE_DEVICES輸出正常,但是沒有解決問題,報錯依舊,
方案2:代碼添加環境變數
在初始化cuda區域最開始添加一下代碼,
import os
os.environ['CUDA_VISIBLE_DEVICES'] =‘0’
還是沒有解決問題,
方案3:重啟服務器
參考了一些文章,提到了如果系統升級了顯卡驅動而沒有重啟的話,也會導致同樣的報錯,
所以重啟了一下服務器,問題解決,
總結
3種方案雖然只有最后一個解決了問題,但是可能因為我的情況特殊,給自己解決程序留個記錄,順便分享一下,
轉載請註明出處,本文鏈接:https://www.uj5u.com/qita/398562.html
標籤:其他
