我試圖根據當年觀察到的值的平均值來填充資料集中缺失的資料,需要很長時間才能一一寫入。我無法使用 for 回圈創建此結構。應該如何編碼?
df['TOTAL_REVENUE'] = df.TOTAL_REVENUE.fillna(df.groupby('YEAR')['TOTAL_REVENUE'].transform('mean'))
df['FEDERAL_REVENUE'] = df.FEDERAL_REVENUE.fillna(df.groupby('YEAR')['FEDERAL_REVENUE'].transform('mean'))
df['STATE_REVENUE'] = df.STATE_REVENUE.fillna(df.groupby('YEAR')['STATE_REVENUE'].transform('mean'))
df['TOTAL_EXPENDITURE'] = df.TOTAL_EXPENDITURE.fillna(df.groupby('YEAR')['TOTAL_EXPENDITURE'].transform('mean'))
我知道這是錯誤的,但我想舉個例子。
for column in df.columns:
df[column] = df.column.fillna(df.groupby('YEAR')[column].transform('mean'))
#df['TOTAL_REVENUE'] = df.TOTAL_REVENUE.fillna(df.groupby('YEAR')['TOTAL_REVENUE'].transform('mean'))
以截圖為例
uj5u.com熱心網友回復:
你會這樣做(使用df[column]而不是df.column):
for column in df.columns:
df[column] = df[column].fillna(df.groupby('YEAR')[column].transform('mean'))
轉載請註明出處,本文鏈接:https://www.uj5u.com/yidong/392742.html
標籤:熊猫 数据框 pandas-groupby
下一篇:鏈接哈希映射計數器未正確遞增
