我有一個關于美國不同州的熊貓資料框。我想在兩列組一年和狀態,以統計學測驗一些東西如致人死亡,新生兒等,并繪制。我只能想出groupbypandas 函式,最后我必須指定一個統計摘要,例如:
import pandas as pd
df = pd.read_csv(path 'csvfile.csv')
grouped_df = df.groupby(['Year', 'State']).mean()
不過,我想在剛組一年和國家獨自一人,但這樣做與groupby我得到這樣的:
import pandas as pd
df = pd.read_csv(path 'csvfile.csv')
grouped_df = df.groupby(['Year', 'State'])
<pandas.core.groupby.generic.DataFrameGroupBy object at 0x0000025720134688>
我怎樣才能做到這一點?
uj5u.com熱心網友回復:
首先groupby是簡化 like iterator,那么在指定之后是什么很重要 - 聚合函式,自定義函式..?
不確定是什么意思group by the year and state alone,如果需要MultiIndex2 列使用:
grouped_df = df.set_index(['Year', 'State'])
轉載請註明出處,本文鏈接:https://www.uj5u.com/qukuanlian/370815.html
上一篇:如何有兩個直方圖但不堆疊?
