我需要根據兩個資料幀之間的條件為一個資料幀中的某些列填充 NaN 值。
DF1 具有 SOL(行首)和 EOL(行尾)列,DF2 具有每個條目的 UTC_TIME。
對于 DF2 中 UTC_TIME >= SOL 且 <= DF1 中每條記錄的 EOL 的每個點,必須為 DF2 中的該行分配 LINE、DEVICE 和 TAPE_FILE。
因此,每個點都將根據 DF1 中 UTC_TIME 之間的 SOL/EOL 時間分配一個 LINE、DEVICE 和 TAPE_FILE。
我正在嘗試像這樣對每一列使用 numpy where 函式
df2['DEVICE'] = np.where(df2['UTC_TIME'] >= df1['SOL'] and <= df1['EOL'])
或者使用 for 回圈遍歷每一行
for point in points:
if df1['SOL'] >= df2['UTC_TIME'] and df1['EOL'] <= df2['UTC_TIME']
return df1['DEVICE']
我是 python 新手,顯然不擅長撰寫語法。如果有人可以提供一些指導或幫助,我將不勝感激。


uj5u.com熱心網友回復:
嘗試merge_asof:
#convert to datetime if needed
df1["SOL"] = pd.to_datetime(df1["SOL"])
df1["EOL"] = pd.to_datetime(df1["EOL"])
df2["UTC_TIME"] = pd.to_datetime(df2["UTC_TIME"])
output = pd.merge_asof(df2[["ID", "UTC_TIME"]],df1,left_on="UTC_TIME",right_on="SOL").drop(["SOL","EOL"],axis=1)
>>> output
ID UTC_TIME LINE DEVICE TAPE_FILE
0 1 2022-04-25 06:50:00 1 Huntec 10
1 2 2022-04-25 07:15:00 2 Teledyne 11
2 3 2022-04-25 10:20:00 3 Huntec 12
3 4 2022-04-25 10:30:00 3 Huntec 12
4 5 2022-04-25 10:50:00 3 Huntec 12
轉載請註明出處,本文鏈接:https://www.uj5u.com/qiye/466910.html
上一篇:C 非整數表現得像0
