我正試圖創建一個機器學習模型來預測每支球隊的位置,但是我在以模型可以訓練的方式來組織資料時遇到了困難。
我希望 pandas 資料框架看起來像這樣。 其中,每場比賽都有隊員不斷地換隊。
而根據輸入的資料,我希望pandas資料框架看起來像這樣
。
并且根據輸入的隊友,模型對球隊的位置進行預測。有沒有人建議我如何制作一個像這樣的pandas資料框架,讓模型可以作為訓練資料使用?我完全被難住了。謝謝大家!
uj5u.com熱心網友回復:
關于如何創建這個表單的問題,你可以很容易地獲得資料并以你上面描述的格式存盤。訣竅在于如何使用它作為你的模型的訓練資料。我們需要將其轉換為數字形式,以便能夠作為任何模型的訓練資料使用。我們知道,在大多數情況下,團隊的最大人數是3人,我們可以將三個人的名字分成三列(如果團隊中的成員少于3人,那么這一列保持空白)。現在我們可以使用Label編碼或One-hot編碼來將名字轉換成數字。你應該創建一個所有三列的組合串列,以fit一個LabelEncoder,然后在每一列上單獨使用transform函式(因為名字可能在這三列中共享)。關于標簽編碼,我們可以很容易地使用基于樹的模型。一熱編碼可能會導致curse of dimensionality,因為會有很多名字,所以我寧愿不在初始的簡單模型中使用它。
轉載請註明出處,本文鏈接:https://www.uj5u.com/yidong/328138.html
標籤:
