我正在嘗試處理我的資料集,其中包含一些特征,每個實體都有一些多個值,如圖所示
https://i.stack.imgur.com/D78el.png
我試圖用“|”分隔每個值 應用 One-Hot 編碼技術的符號,但我找不到任何合適的解決方案來解決我的問題
我的想法是將每個多個值保留在一行中或通過另一個單詞將每個單元格轉換為整數串列
uj5u.com熱心網友回復:
也許這就是你想要的:
df = pd.DataFrame(['465','444','465','864|857|850|843'],columns=['genre_ids'])
df
genre_ids
0 465
1 444
2 465
3 864|857|850|843
df['genre_ids'].str.get_dummies(sep='|')
444 465 843 850 857 864
0 0 1 0 0 0 0
1 1 0 0 0 0 0
2 0 1 0 0 0 0
3 0 0 1 1 1 1
轉載請註明出處,本文鏈接:https://www.uj5u.com/yidong/467557.html
