我有一個時間序列作為資料框。第一列是周數,第二列是該周的值。第一周 (22) 和最后一周 (48) 是時間序列的下限和上限。有些周丟失了,例如,沒有第 27 周和第 28 周。我想重新采樣這個系列,以便沒有丟失的周。在插入一周的地方,我希望相應的值為零。這是我的資料:
week value
0 22 1
1 23 2
2 24 2
3 25 3
4 26 2
5 29 3
6 30 3
7 31 3
8 32 7
9 33 4
10 34 5
11 35 4
12 36 2
13 37 3
14 38 10
15 39 5
16 40 7
17 41 10
18 42 11
19 43 15
20 44 9
21 45 13
22 46 5
23 47 6
24 48 2
我想知道這是否可以在 Pandas 中實作,而無需從頭開始創建回圈。我已經查看了 pd.resample,但無法達到我正在尋找的結果。
uj5u.com熱心網友回復:
我將設定week為索引,使用fill_value選項重新索引:
start, end = df['week'].agg(['min','max'])
df.set_index('week').reindex(np.arange(start, end 1), fill_value=0).reset_index()
輸出(頭):
week value
0 22 1
1 23 2
2 24 2
3 25 3
4 26 2
5 27 0
6 28 0
7 29 3
8 30 3
轉載請註明出處,本文鏈接:https://www.uj5u.com/net/376287.html
上一篇:Pyspark-合并資料框
