我在一個資料框中有資料,看起來像這樣,其中每一列都是一個 KEYWORD,每一行都是對每個 ID 說這個詞的次數的觀察:
| ID | 百吉餅 | 比薩 |
|---|---|---|
| 美國廣播公司 | 2 | 3 |
| 防御工事 | 1 | 3 |
| 全球健康指數 | 7 | 9 |
| 全部的 | 10 | 15 |
我試圖把它變成一種形式,在那里我可以看到最流行的詞是什么,列本身是新列,而 TOTAL 行轉換為可以排序的列:
| 柱子 | 全部的 |
|---|---|
| 百吉餅 | 10 |
| 比薩 | 15 |
我已經嘗試過melt,stack但我認為我沒有正確使用任何一個。任何幫助表示贊賞。
uj5u.com熱心網友回復:
選擇列然后 T
out = df[df.id.eq('TOTAL')].set_index('id').T.reset_index()
Out[433]:
id index TOTAL
0 bagel 10
1 pizza 15
uj5u.com熱心網友回復:
您可以使用 df.sum()
data = df.sum(numeric_only=True, axis=0)
上面的代碼將回傳一個系列,您需要使用下面的語法將其轉換為 DataFrame 并設定列名。
df = pd.DataFrame({'Column':data.index, 'Total':data.values})
print(df)
這給了我,
Column Total
0 bagel 10
1 pizza 15
您還可以執行以下操作將Column列設定為洗掉(0、1 等)索引的索引。
df = df.set_index('Column')
print(df)
這給了我,
Total
Column
bagel 10
pizza 15
轉載請註明出處,本文鏈接:https://www.uj5u.com/qukuanlian/369397.html
下一篇:如何解釋箱線圖?
