我如何能夠創建一個將data1, data2 and data3. 代碼必須將與所有 3 個資料集相同的所有列組合在一起,因此Lowindata1不常見,data2/3因此將被排除在外。資料按同步順序排序,每一行必須是唯一的,不能有兩個相同的日期。在data2 data3包含日期的行中:2021-10-21 00:03:00但只有一行該資料在輸出中,因為它不是唯一的行。我如何才能執行此代碼?
import pandas as pd
import numpy as np
import functools
data1 =pd.read_csv('dataset1.csv', low_memory=False)
data2 =pd.read_csv('dataset2.csv', low_memory=False)
data3 ==pd.read_csv('dataset3.csv', low_memory=False)
資料 1 csv:
Unix Timestamp date Symbol Open High Low
1444311600000 2015-10-08 13:40:00 BTCUSD 10384.54 10389.08 10340.2
1444311660000 2015-10-08 13:41:00 BTCUSD 10389.08 10389.08 10332.8
1444311720000 2015-10-08 13:42:00 BTCUSD 10387.15 10388.36 10385
資料 2 csv:
Unix Timestamp Date Symbol Open High
1634774460000 2021-10-21 00:01:00 BTCUSD 4939.95 4939.97
1634774520000 2021-10-21 00:02:00 BTCUSD 4959.18 4961.75
1634774580000 2021-10-21 00:03:00 BTCUSD 4964.33 4964.33
資料3 csv:
Unix Timestamp Date Symbol Open High
1634774580000 2021-10-21 00:03:00 BTCUSD 4964.33 4964.33
1634774640000 2021-10-21 00:04:00 BTCUSD 4800.2 4867.47
預期輸出:
Unix Timestamp date Symbol Open High
1444311600000 2015-10-08 13:40:00 BTCUSD 10384.54 10389.08
1444311660000 2015-10-08 13:41:00 BTCUSD 10389.08 10389.08
1444311720000 2015-10-08 13:42:00 BTCUSD 10387.15 10388.36
1634774460000 2021-10-21 00:01:00 BTCUSD 4939.95 4939.97
1634774520000 2021-10-21 00:02:00 BTCUSD 4959.18 4961.75
1634774580000 2021-10-21 00:03:00 BTCUSD 4964.33 4964.33
1634774640000 2021-10-21 00:04:00 BTCUSD 4800.2 4867.47
uj5u.com熱心網友回復:
使用 append 然后 drop_duplicates
data1.drop('Low',1).append([data2, data3], ignore_index=True).drop_duplicates()
轉載請註明出處,本文鏈接:https://www.uj5u.com/qiye/342504.html
下一篇:獲取不同格式的卡號年份之間的差異
