我有一個資料框:
df = c l
A [1,2,3]
A [1,2,3,4]
B [1]
我想獲得列的平均長度(和標準差)l,每組c. 所以這里的輸出將是: A : 3.5 B : 1
這樣做的最佳方法是什么?
uj5u.com熱心網友回復:
Series.str.len與聚合一起使用mean:
s = df['l'].str.len().groupby(df['c']).mean()
print (s)
c
A 3.5
B 1.0
Name: l, dtype: float64
或者聚合多個函式:
df = df['l'].str.len().groupby(df['c']).agg(['mean','std'])
print (df)
mean std
c
A 3.5 0.707107
B 1.0 NaN
轉載請註明出處,本文鏈接:https://www.uj5u.com/caozuo/360286.html
標籤:熊猫 数据框 pandas-groupby
上一篇:選擇具有OR條件的列的最佳方法
下一篇:合并僅提供5行而不是7行
