我是 RAPIDS AI 世界的新手,我決定第一次嘗試 CUML 和 CUDF。我在 WSL 2 上運行 UBUNTU 18.04。我的主要作業系統是 Windows 11。我有 64 GB RAM 和筆記本電腦 RTX 3060 6 GB GPU。
在我寫這篇文章的時候,我正在對一個由大約 26000 個值組成的 CUDF 資料幀運行 TSNE 擬合計算,這些值存盤在 7 列中(所有值都是數字或二進制值,因為分類值是一個熱編碼的)。雖然像 LogisticRegression 或 SVM 這樣的分類器非常快,但 TSNE 似乎需要一段時間才能輸出結果(現在已經一個多小時了,即使 Dataframe 不是那么大,它仍在繼續)。任務管理器告訴我 100% 的 GPU 正在用于計算,即使通過在 windows powershell 上運行“nvidia-smi”,命令回傳當前總共 6 GB 中只有 1.94 GB 正在使用. 這對我來說似乎很奇怪,因為我閱讀了有關 RAPIDS AI 的 TSNE 演算法比標準 scikit-learn 演算法快 20 倍的論文。
我想知道是否有辦法增加專用 GPU 記憶體的百分比以執行更快的計算,或者它是否只是與 WSL 2 相關的問題(可能它將 GPU 的使用限制在 2 GB)。
有什么建議或想法嗎?非常感謝
uj5u.com熱心網友回復:
任務管理器告訴我 100% 的 GPU 正在用于計算
我不確定 Windows 任務管理器是否能夠告訴您計算所達到的 GPU 吞吐量。
在 windows powershell 上的“nvidia-smi”,該命令回傳總共 6 GB 中只有 1.94 GB 正在使用中
記憶體利用率是與 GPU 吞吐量不同的計算。任何 GPU 應用程式只會使用請求的記憶體量,并且更高的記憶體使用量和更高的吞吐量之間沒有關聯,除非應用程式特別提到可以通過使用更多記憶體來實作更高吞吐量的方法(例如,不同的演算法對于相同的計算可能會使用更多的記憶體)。
TSNE 似乎需要一段時間才能輸出結果(現在已經一個多小時了,即使 Dataframe 沒有那么大,它仍然在進行)。
這絕對看起來很奇怪,而不是小資料集的預期行為。您使用的是什么版本的 cuML,您method對 fit 任務的論點是什么?您是否還可以在www.github.com/rapidsai/cuml/issues上打開一個問題,以訪問您的資料集以便重現該問題?
轉載請註明出處,本文鏈接:https://www.uj5u.com/ruanti/411796.html
標籤:
上一篇:這個基本的線性回歸有什么問題?
