我有下面的資料框,我想創建一個新列,顯示 ID 的最高分。分數來自 AZ。A = 低分,Z = 高分。
| ID | 分數 |
|---|---|
| 001 | 一個 |
| 001 | 乙 |
| 001 | C |
| 002 | 一個 |
| 002 | 一個 |
| A003 | 乙 |
| A003 | G |
| A003 | G |
輸出
| ID | 分數 | 新欄目 |
|---|---|---|
| 001 | 一個 | C |
| 001 | 乙 | C |
| 001 | C | C |
| 002 | 一個 | 一個 |
| 002 | 一個 | 一個 |
| A003 | 乙 | G |
| A003 | G | G |
| A003 | G | G |
有什么方法可以輕松完成此操作嗎?
uj5u.com熱心網友回復:
分組依據ID和變換依據max:
df['New Column'] = df.groupby('ID').transform('max')
輸出:
>>> df
ID Score New Column
0 001 A C
1 001 B C
2 001 C C
3 002 A A
4 002 A A
5 A003 E G
6 A003 G G
7 A003 G G
轉載請註明出處,本文鏈接:https://www.uj5u.com/qiye/400822.html
上一篇:熊貓日歷問題
