我在使用Faster RCNN訓練網路時每次跑一半就會出現
Unable to determine the device handle for GPU 0000:03:00.0: GPU is lost. Reboot the system to recover this GPU
的錯誤,然后網路就卡著不訓練了。之前重啟之后重新訓練就沒什么問題,但是現在重啟之后重新訓練還是會出現這個問題。有人知道怎么解決嗎?
uj5u.com熱心網友回復:
我也遇到了
uj5u.com熱心網友回復:
后來我每次這樣重啟基本就能解決,具體也不太知道啥原因。uj5u.com熱心網友回復:
好像是GPU負載過高的原因,我四卡全開就掛了。只用3張卡都沒事。轉載請註明出處,本文鏈接:https://www.uj5u.com/qita/41812.html
標籤:機器視覺
上一篇:大佬進來看看 在線小白求救
