我有兩個資料date框,具有相同的欄位,但其他欄位不同。我需要將一列pneumonia_ARVI從 dataframe添加pneumonia_ARVI到 dataframe Result_data。
它們最初在日期數量上有所不同,Result_data資料框中的日期明顯多于pneumonia_ARVI

我需要與日期匹配的串聯,但如果資料框中的記錄pneumonia_ARVI比資料框中的記錄多Result_data,則首選項將具有資料集中指定的日期Result_data。并且資料集中缺失的資料pneumonia_ARVI替換為空值。
我試過做
Result_data = Result_data.set_index('date')
pneumonia_ARVI = pneumonia_ARVI.set_index('date')
End = pd.merge(Result_data, pneumonia_ARVI, left_index=True, right_index=True)
但這導致資料相互調整,并且該欄位infected_city不會按日期保留所有原始值。
如何正確組合這些資料,以便減少日期總數沒有問題?
uj5u.com熱心網友回復:
使用join:
#convert to datetime if needed
Result_data["date"] = pd.to_datetime(Result_data["date"])
pneumonia_ARVI["date"] = pd.to_datetime(pneumonia_ARVI["date"])
#set index as you have done
Result_data = Result_data.set_index('date')
pneumonia_ARVI = pneumonia_ARVI.set_index('date')
#perform a left join
End = Result_data.join(pneumonia_ARVI, how="left")
轉載請註明出處,本文鏈接:https://www.uj5u.com/net/349892.html
上一篇:查找多個模式并合并
