如下所示填充了熊貓資料框 df_sales。對于每個 ID,有多個日期,所有日期都按問題之前顯示的順序進行分組和排序。
ID Date Sales
a 01/01/2020 20
a 02/01/2020 65
a 03/01/2020 31
b 01/01/2020 25
b 02/01/2020 15
b 03/01/2020 42
c 01/01/2020 31
c 02/01/2020 50
c 03/01/2020 25
現在,我想在同一資料框中查看最近 2 天的銷售額總和,如下所示。
ID Date Sales Sales in last 2 days
a 01/01/2020 20 20
a 02/01/2020 65 85
a 03/01/2020 31 96
b 01/01/2020 25 25
b 02/01/2020 15 40
b 03/01/2020 42 57
c 01/01/2020 31 31
c 02/01/2020 50 81
c 03/01/2020 25 75
您能否建議這怎么可能?提前謝謝了。
我嘗試分組和聚合,但是我無法僅在過去 2 天進行迭代,尤其是在沒有先前日期值的情況下。
uj5u.com熱心網友回復:
希望我理解正確,嘗試使用Shift來獲取上一行的值并創建一個名為“過去 2 天的銷售額”的新列
import pandas as pd
id_col = ['a','a','a','b','b','b','c','c','c']
date_rng = ['2020-01-01','2020-01-02','2020-01-03','2020-01-01','2020-01-02','2020-01-03',\
'2020-01-01','2020-01-02','2020-01-03']
sales = [20,65,31,25,15,29,23,5,65]
df = pd.DataFrame({'ID':id_col, 'Date':date_rng, 'Sales':sales})
id_grp = df.groupby(['ID'])
df_list = []
for df_grp in id_grp:
df_grp[1]['Sales in last 2 days'] = df_grp[1]['Sales'] df_grp[1]['Sales'].shift().fillna(0)
df_list.append(df_grp[1])
print(pd.concat(df_list))
轉載請註明出處,本文鏈接:https://www.uj5u.com/houduan/453326.html
