我有一個資料框:
id is_good
a1 1
a1 1
a1 0
bb 1
bb 0
bb 0
bb 0
我想為每個 id 計算 0 和 1 的百分比。所以想要的結果是:
id is_good_perc
a1 0.67
bb 0.25
怎么做?之后我該怎么辦groupby("id")?
uj5u.com熱心網友回復:
一般情況:
df.groupby("id").is_good.value_counts(normalize=True)
# id is_good
# a1 1 0.666667
# 0 0.333333
# bb 0 0.750000
# 1 0.250000
# Name: is_good, dtype: float64
在你的情況下,因為你有二進制變數,我會利用@sushanth 在評論中的內容并使用df.groupby('id')['is_good'].mean().
轉載請註明出處,本文鏈接:https://www.uj5u.com/net/313007.html
