我有一個包含兩個日期時間列的資料集(比如說 Call_Date 和 Transaction_Date)。Call_Date 總是被填充,因為我們只是在尋找我們能夠接觸到消費者的實體。然后,如果消費者進行交易,我們填充 Transaction_Date。因此,Transaction_date 并不總是被填充。
我想要知道的是,當兩個日期都被填充時,消費者在通話后多少天進行了交易,而沒有洗掉消費者沒有進行交易的情況。
有什么辦法嗎?
最小的例子
df = pd.DataFrame({'Customer': ['ABC','XYZ','PQR'],
'Call_Date': ['12/8/2021 2:31:07 PM','20/8/2021 5:27:02 AM','5/8/2021 7:29:40 PM'],
'Transaction_Date': ['16/8/2021 9:21:58 PM', pd.NaT, pd.NaT]})
uj5u.com熱心網友回復:

以下為我作業。請檢查所附影像以查看輸出
from dateutil.parser import *
import pandas as pd
import numpy as np
df = pd.DataFrame({'Customer': ['ABC','XYZ','PQR'],
'Call_Date': ['12/8/2021 2:31:07 PM','20/8/2021 5:27:02 AM','5/8/2021 7:29:40 PM'],
'Transaction_Date': ['16/8/2021 9:21:58 PM','','']})
df['DUR'] = df.apply(lambda x : parse(x.Call_Date,fuzzy=True) - parse(x.Transaction_Date,fuzzy=True) if \
len(x.Transaction_Date) != 0 else np.nan, axis=1)
另一種方法可以使用如下,包括一個函式 diff() 來實作例外處理,所以現在它對于任何型別的 Null/String/datetime 都不是問題。
請查看庫檔案:https ://dateutil.readthedocs.io/en/stable/parser.html
def diff(datetime_old, datetime_new):
try: return abs(parse(str(datetime_new), fuzzy=True) - parse(str(datetime_old), fuzzy=True))
except: return np.nan
df['DUR'] = df.apply(lambda x : diff(x.Call_Date, x.Transaction_Date) if pd.notnull(x.Transaction_Date) else np.nan, axis=1)
轉載請註明出處,本文鏈接:https://www.uj5u.com/yidong/483937.html
上一篇:想要顯示日期計數器
