我有一個類似于以下內容的資料框:
ColA ColB Year ...
=====================
1 2 2007
2 5 2007
3 4 2007
4 3 2007
5 2 2008
6 1 2008
7 0 2008
8 9 2008
...
我正在使用dat[['ColA', 'ColB']].describe(). 當我這樣做時,正如預期的那樣,它會顯示這兩列多年來的匯總統計資訊。我想按年對每一列進行匯總統計。在上面的示例中,我將有 4 列統計資訊(1 列用于ColA2007 年,1 列用于ColA2008 年,1 列用于ColB2007 年,1 列用于ColB2008 年)。有沒有辦法擴展pd.describe()適應這種情況的能力?
uj5u.com熱心網友回復:
您可以在致電之前按年份分組describe:
df_example = pd.DataFrame({"colA": [1, 2, 3, 4, 5, 6, 7, 8],
"Year": [2007, 2007, 2007, 2007, 2008, 2008, 2008, 2008]})
des = df_example.groupby("Year").describe()
print(des)
colA
count mean std min 25% 50% 75% max
Year
2007 4.0 2.5 1.290994 1.0 1.75 2.5 3.25 4.0
2008 4.0 6.5 1.290994 5.0 5.75 6.5 7.25 8.0
轉載請註明出處,本文鏈接:https://www.uj5u.com/qiye/531561.html
下一篇:物體框架不要在查詢結果中包含列
