假設我有下表:
| ID | 姓名 | 郵件 | 日期 |
|---|---|---|---|
| 1 | 站 | [email protected] | 11.11.22 |
| 2 | 丹尼 | [email protected] | 11.11.22 |
| 3 | 艾麗 | [email protected] | 11.11.22 |
| 4 | 艾麗 | [email protected] | 11.11.22 |
| 5 | 艾麗 | [email protected] | 12.11.22 |
為特征子集 [名稱,日期] 重復觀察創建增量計數器的最佳方法是什么?
期望的輸出:
| ID | 姓名 | 郵件 | 日期 | 柜臺 |
|---|---|---|---|---|
| 1 | 站 | [email protected] | 11.11.22 | 1 |
| 2 | 丹尼 | [email protected] | 11.11.22 | 1 |
| 3 | 艾麗 | [email protected] | 11.11.22 | 1 |
| 4 | 艾麗 | [email protected] | 11.11.22 | 2 |
| 5 | 艾麗 | [email protected] | 12.11.22 | 1 |
編輯:表格本身已正確排序,重復項出現在彼此之后。
uj5u.com熱心網友回復:
df['counter'] = df.groupby(['name', 'date']).cumcount() 1
df
id name mail date counter
0 1 Sta [email protected] 11.11.22 1
1 2 Danny [email protected] 11.11.22 1
2 3 Elle [email protected] 11.11.22 1
3 4 Elle [email protected] 11.11.22 2
4 5 Elle [email protected] 12.11.22 1
轉載請註明出處,本文鏈接:https://www.uj5u.com/shujuku/476621.html
上一篇:使用pandas提取excel檔案中所有列的所有唯一值
下一篇:合并具有多個條件的2個資料框
