背景:在我的專案中,我使用 GIT 和DVC來跟蹤版本:
- GIT - 僅適用于源代碼
- DVC - 用于資料集、模型物件和輸出
我在不同的分支中測驗不同的方法,即:
- 隨機森林
- 神經網路_1
- ...
通常作為輸出,我將預測保存在具有標準化名稱的 csv 檔案中(即:pred_test.csv)。因此,在不同的分支中,我有不同的 pred_test.csv 檔案。該檔案的結構非常簡單,它包含兩列:
- ID
- 預言
問題:將這些預測檔案合并為單個大檔案的最佳方法是什么?
我想獲得一個具有以下結構的檔案:
- ID
- 預測隨機森林
- Prediction_neural_network_1
- 預言_...
我的主要問題是如何訪問具有不同分支中的預測的檔案?
uj5u.com熱心網友回復:
我會嘗試dvc get在這種情況下使用:
dvc get -o random_forest_pred.csv --rev random_forest . pred_test.csv
它應該pred_test.csv從random_forest分支帶來。
請注意
.之前pred_test.csv,它是必需的,這意味著“使用當前 repo”,因為dvc get也可以在其他 repo 上使用(例如 GitHub URL)
然后我認為您可以使用一些 CLI 或撰寫腳本來加入檔案:
https://unix.stackexchange.com/questions/293775/merging-contents-of-multiple-csv-files-into-single-csv-file
轉載請註明出處,本文鏈接:https://www.uj5u.com/houduan/426901.html
