我試圖直觀地比較資料框中的兩列,它要么用“頻率”而不是其中一列制作一個奇怪的表
我嘗試了這些選項:
ct1=pd.crosstab(df['releaseyear'],df['score'],normalize=True)
ct1.plot()
df.plot( x='releaseyear', y='score', kind='hist')
還有一個散點圖,它使 x 和 y 正確,但我不知道如何對其進行標準化,所以它只會顯示每年的平均值,而不是所有資料
plt.scatter(df['releaseyear'], df['score'])
plt.show()
uj5u.com熱心網友回復:
沒有適當的資料可用于重現資料框或有關資料框外觀的線索。
這個答案是根據我的理解,如果資料是這樣的
year score
2001 20
2001 18
2002 12
2002 16
然后首先使用 groupby 并根據年份分組資料并應用所需的聚合函式。
df=df.groupby('year').mean().reset_index()
輸出
year score
0 2001 19.0
1 2002 14.0
然后,您可以相應地繪制資料。
轉載請註明出處,本文鏈接:https://www.uj5u.com/qiye/421096.html
標籤:
