我有一個這樣的 CSV 檔案
F1 | F2 | F3 | F4 | Label
我使用 將get_dummies標簽更改為 one-hot 編碼表示,資料包含 3 個不同的標簽,所以檔案現在看起來像
F1 | F2 | F3 | F4 | Label1 | Label2 | Label3
假設我想使用這些資料來訓練機器學習模型。我必須確定功能和標簽列,我可以將其設定為:
Features, x = [0:3]
Labels, y = [4:6]
這樣對嗎?我在想,通過這種方式,也許這可以理解為一個多標簽問題,因為這不是!最初它是一個多類分類。
任何幫助將不勝感激。
uj5u.com熱心網友回復:
您可以嘗試iloc或使用filter
x = df.iloc[:, :4]
y = df.iloc[:, 4:]
# or
x = df.filter(like='F')
y = df.filter(like='Label')
print(x)
F1 F2 F3 F4
0 1 2 3 4
1 1 2 3 4
2 1 2 3 4
print(y)
Label1 Label2 Label3
0 x y z
1 x y z
2 x y z
轉載請註明出處,本文鏈接:https://www.uj5u.com/qukuanlian/479467.html
上一篇:當我用keras訓練網路時,為什么我的預測形狀不準確?
下一篇:熊貓置換范圍內的值以創建垃圾箱
