我有這樣的字典:
tr1 = {'label': 'name1', 'date': '2021-09-29'}
tr2 = {'label': 'name1', 'date': '2021-08-30'}
tr3 = {'label': 'name1', 'date': '2021-09-30'}
tr4 = {'label': 'name2', 'date': '2021-06-30'}
tr5 = {'label': 'name2', 'date': '2021-05-30'}
tr6 = {'label': 'name3', 'date': '2021-06-30'}
我想得到一個這樣的串列:
[1, 1, 1, 30, 0]
此串列是具有相同標簽的字典的日期(以天為單位)之間的最小間隔,如果我們沒有其他具有相同標簽的字典,則為 0。我嘗試使用 dataframe、groupby 和 .transfrom 但這不起作用:
df_day = pd.DataFrame(sample_transaction)
df_day.date = df_day.date.apply(lambda x :
int(datetime.datetime.timestamp(
datetime.datetime.strptime(x, "%Y-%m-%d"))))
group_day = df_day[['label', 'date']].groupby(['label'])
group_day.transform(
lambda x: min([abs(a - b) if a != b else 0.0 for a in x for b in x]))
sample_transaction只是里面有字典的串列,我試圖用時間戳將日期轉換為秒,我試圖用變換和 lambda 進行計算,但我只得到一個 0.0 的串列
uj5u.com熱心網友回復:
IIUC,您可以對每組的日期進行排序并獲得最小值diff:
l = [tr1, tr2, tr3, tr4, tr5, tr6]
(pd.DataFrame(l)
.assign(date=lambda d: pd.to_datetime(d['date']))
.groupby('label')['date']
.transform(lambda s: s.sort_values().diff().min())
)
輸出:
0 1 days 00:00:00
1 1 days 00:00:00
2 1 days 00:00:00
3 31 days 00:00:00
4 31 days 00:00:00
5 NaT
Name: date, dtype: object
對于提供的確切格式:
(pd.DataFrame(l)
.assign(date=lambda d: pd.to_datetime(d['date']))
.groupby('label')['date']
.transform(lambda s: s.sort_values().diff().min().days)
.fillna(0, downcast='infer')
.to_list()
)
輸出:
[1, 1, 1, 31, 31, 0]
轉載請註明出處,本文鏈接:https://www.uj5u.com/net/479579.html
上一篇:如何在YMDHMS(ISO8601)中獲取兩個日期/時間之間的持續時間
下一篇:將兩個熊貓資料框與日期變數合并
