我有一個看起來像這樣的資料框。請注意 total_customer 列,它有 500 多個按日期后綴區分。
total_customer total_customer_2021-03-31 total_customer_date X
1 10 4
3 14 3
現在,我想通過洗掉日期后綴來按行總結相同的列,因此無法手動完成。即預期的輸出是:
total_customer
15
20
我無法手動執行此操作的問題是因為我有 500 多個列對,因此我需要一種有效的方法來執行此操作。此外,列的順序也無法預測。你有什么建議嗎?謝謝!
uj5u.com熱心網友回復:
如果有不同的組使用DataFrame.groupby聚合sum:
df1 = df.groupby(df.columns.str.replace('[0-9-_] $',''), axis=1).sum()
或者,如果需要對所有列進行求和,則僅使用sum注釋:
df1 = df.sum(axis=1).to_frame(name='total_customer')
轉載請註明出處,本文鏈接:https://www.uj5u.com/gongcheng/310956.html
