我正在嘗試為一長串不同的統計資訊有效地計算不同的特征,例如'Last Game',等等,我將這些統計資訊放在最后命名的. 因為大約有 100 個統計資料和 100 個計算(我已經展示了以下功能之一作為示例),所以它變得不可行。'Season Average'GameStatistics'Last Game'
這是我當前的代碼,其中指定統計資訊的新列名是必不可少的:
for Statistic in GameStatistics:
df[f'{Statistic} - Last Game'] = df.groupby('Name')[Statistic].shift()
有沒有更快的方法來計算所有統計資料的特征,可能同時,因此只需要執行每個 pandas 分組功能一次?
uj5u.com熱心網友回復:
我不知道你有多少游戲資料。但在我的測驗中,即使有 1000 個統計資料,您的代碼也能正常運行。
當然還有改進的余地。使用 pandas 時,您應該尋找矢量化方法,而不是依賴回圈。這是一種方法:
result = pd.concat(
[df, df.groupby("Name")[GameStatistics].shift().add_suffix(" - Last Game")],
axis=1
)
轉載請註明出處,本文鏈接:https://www.uj5u.com/shujuku/456734.html
標籤:Python 熊猫 表现 通过...分组 熊猫-groupby
