我有一個保存為熊貓資料框的詞頻矩陣。
1000 Merkwürdig Mindestens Error ... Periode bildet 30 Button
0 0 0 0 0 ... 0 0 0 0
1 0 1 0 2 ... 0 0 0 0
2 0 0 0 0 ... 0 0 0 0
3 0 0 0 0 ... 0 0 0 0
4 0 0 1 0 ... 0 0 1 0
.. ... ... ... ... ... ... ... .. ...
121 0 0 0 0 ... 0 0 0 1
122 0 0 0 0 ... 0 0 0 0
123 0 0 0 0 ... 0 0 0 0
124 0 0 0 0 ... 0 0 0 0
對于每一行,我想計算單詞出現的次數,在末尾添加一個名為“count”的列,并保存每行的 wordcount。
1000 Merkwürdig Mindestens Error ... Periode bildet 30 Button count
0 0 0 0 0 ... 0 0 0 0 0
1 0 1 0 2 ... 0 0 0 0 3
2 0 0 0 0 ... 0 0 0 0 0
迭代每一行和每一列可能不是最好的解決方案,所以這可以矢量化嗎?
uj5u.com熱心網友回復:
你可以使用.sum方法
df['count'] = df.sum(axis=1)
uj5u.com熱心網友回復:
Pandas 有一個 sum 函式,可以滿足您的需求pd.sum()。您需要設定 axis=1 以告訴它跨行而不是跨列求和。見下文:
df['count'] = df.sum(axis=1)
轉載請註明出處,本文鏈接:https://www.uj5u.com/caozuo/358426.html
