我有資料框
df1 = pd.DataFrame({'id': ['1','2','2','3','3','4','5'],
'event': ['Basket','Soccer','Soccer','Basket','Soccer','Basket','Soccer']})
我想計算事件的唯一值,但排除重復的 id。我期望的結果是:
event count
Basket 3
Soccer 3
uj5u.com熱心網友回復:
這將起作用:
df1.groupby('event').agg({'id':lambda x: len(pd.unique(x))})
# OR
df1.groupby(['event']).agg(['nunique'])
輸出:

uj5u.com熱心網友回復:
您可以使用函式 drop_duplicates 洗掉資料框中的重復項:
df1 = df1.drop_duplicates()
然后,您只需按事件分組并使用計數聚合功能:
df1 = df1.groupby("event").agg("count")
轉載請註明出處,本文鏈接:https://www.uj5u.com/yidong/524425.html
標籤:熊猫数据框
