您能幫我解決以下錯誤嗎:
ValueError:無法使用方法或限制重新索引非唯一索引
假設我有一個資料框 df
datetime A B C
2020-07-02 23:00:01 50 nan nan
2020-07-02 23:00:02 nan 60 nan
2020-07-02 23:00:11 nan nan 80
2020-07-02 23:14:01 nan nan 65
2020-07-02 23:15:01 nan 90 nan
2020-07-02 23:15:02 10 nan nan
2020-07-02 23:28:01 20 25 nan
2020-07-02 23:30:01 nan nan 80
我想要實作的是以下輸出:
datetime A B C
2020-07-02 23:00:00 50 60 80
2020-07-02 23:15:00 10 90 65
2020-07-02 23:30:01 20 25 80
我用以下代碼嘗試了這個:
df.datetime = pd.to_datetime(dfinal.datetime)
resampledata = df.set_index("tijd").resample("15T").pad()
但我得到一個錯誤可能是由于沒有唯一的日期時間值。
uj5u.com熱心網友回復:
假設您的資料框稱為df,請使用pd.Grouper
df['datetime'] = pd.to_datetime(df['datetime'])
df.set_index('datetime').groupby(pd.Grouper(freq='15min')).sum()
輸出將是:
| datetime | A | B | C |
|:--------------------|----:|----:|----:|
| 2020-07-02 23:00:00 | 50 | 60 | 145 |
| 2020-07-02 23:15:00 | 30 | 115 | 0 |
| 2020-07-02 23:30:00 | 0 | 0 | 80 |
當然,您可以根據需要更改范圍
轉載請註明出處,本文鏈接:https://www.uj5u.com/yidong/488333.html
