我有兩個熊貓資料框如下:
ts1
Out[50]:
soil_moisture_ids41
date_time
2007-01-07 05:00:00 0.1830
2007-01-07 06:00:00 0.1825
2007-01-07 07:00:00 0.1825
2007-01-07 08:00:00 0.1825
2007-01-07 09:00:00 0.1825
... ...
2017-10-10 20:00:00 0.0650
2017-10-10 21:00:00 0.0650
2017-10-10 22:00:00 0.0650
2017-10-10 23:00:00 0.0650
2017-10-11 00:00:00 0.0650
[94316 rows x 3 columns]
另一個是
ts2
Out[51]:
soil_moisture_ids42
date_time
2016-07-20 00:00:00 0.147
2016-07-20 01:00:00 0.148
2016-07-20 02:00:00 0.149
2016-07-20 03:00:00 0.150
2016-07-20 04:00:00 0.152
... ...
2019-12-31 19:00:00 0.216
2019-12-31 20:00:00 0.216
2019-12-31 21:00:00 0.215
2019-12-31 22:00:00 0.215
2019-12-31 23:00:00 0.215
[30240 rows x 3 columns]
您可以看到,從2007-01-07到2016-07-19,只有ts1資料點。從2016-07-20到2017-10-11 有一些重疊的時間序列。現在我想組合這兩個資料框。ts1在重疊期間,我想獲得超過和的平均值ts2。在非重疊期間(2007-01-07to2016-07-19和2017-10-12to 2019-12-31),每個時間戳的值設定為 fromts1或的值ts2。那么我該怎么做呢?
謝謝!
uj5u.com熱心網友回復:
concat與 aggregate 一起使用mean,如果只有一個值獲得相同的輸出,如果多個 get mean。最后DatatimeIndex也是排序的:
s = pd.concat([ts1, ts2]).groupby(level=0).mean()
轉載請註明出處,本文鏈接:https://www.uj5u.com/caozuo/469378.html
上一篇:自動完成在UNITY的新VisualStudio2022中不起作用
下一篇:當我嘗試gitremoteremoveorigin時,為什么Git會告訴我“錯誤:沒有這樣的遠程'origin'”?
