我有一個 pandas 資料集,它查看n一個實體隨時間變化的案例數量。
我已從第一個記錄日期開始按升序對資料集進行排序,并創建了一個名為“更改”的新列。
但是,我不確定如何從列中獲取資料n并將其映射到“更改”列,以便“更改”列中的每個單元格代表與前一天的差異。
例如,如果在第 334天有病例,在n = 14000第 335 天有n = 14500病例,則在相應的“更改”單元格中,我希望它說“500”。
過去幾個小時我一直在嘗試,但無濟于事,所以來這里尋求幫助。
我知道這比我想要的更冗長,但是如果您需要任何澄清,請告訴我。
uj5u.com熱心網友回復:
import pandas as pd
df = pd.DataFrame({
'date': [1,2,3,4,5,6,7,8,9,10],
'cases': [100, 120, 129, 231, 243, 212, 375, 412, 440, 1]
})
df['change'] = df.cases.diff()
輸出
date cases change
0 1 100 NaN
1 2 120 20.0
2 3 129 9.0
3 4 231 102.0
4 5 243 12.0
5 6 212 -31.0
6 7 375 163.0
7 8 412 37.0
8 9 440 28.0
9 10 1 -439.0
轉載請註明出處,本文鏈接:https://www.uj5u.com/caozuo/428714.html
上一篇:如何將帶有start和end的structcolumntimestamp轉換為普通的pythonicstamp列?
