我有以下格式的訓練資料集:
print(data.head(5))
#Output
0 1
0 a b c d e 1
1 a b c d e 1
2 a b c d e 1
3 a b c d e 1
4 a b c d e 1
這是一個文本分類任務,我正在嘗試將文本“abcd e”拆分為 Python 串列。我嘗試了迭代:
data #the dataset
len_data = len(data)
for row_num in range(len_data):
data.loc[row_num, 0] = data.loc[row_num, 0].split(" ")
但是,這不起作用并回傳錯誤Must have equal len keys and value when setting with an iterable。有人可以幫我解決這個問題嗎?非常感謝!
uj5u.com熱心網友回復:
使用str.split:
df[0] = df[0].str.split()
print(df)
# Output
0 1
0 [a, b, c, d, e] 1
1 [a, b, c, d, e] 1
2 [a, b, c, d, e] 1
3 [a, b, c, d, e] 1
4 [a, b, c, d, e] 1
設定:
data = {0: {0: 'a b c d e', 1: 'a b c d e'}, 1: {0: 1, 1: 1}}
df = pd.DataFrame(data)
轉載請註明出處,本文鏈接:https://www.uj5u.com/caozuo/428696.html
上一篇:在散點圖中使用直方圖資訊
下一篇:匯入CSV時如何解決以下錯誤
