我有一個名為“日期”的列,它是一個物件,它具有非常不同的日期格式,如 dd.m.yy、dd.mm.yyyy、dd/mm/yyyy、dd/mm、m/d/yyyy 等,如下所示. 顯然,簡單地使用 df['date'] = pd.to_datetime(df['date']) 是行不通的。我想知道這樣混亂的日期值,是否有標準化的日期并將其轉換為一種格式?
date
17.2.22 # means Feb 17 2022
23.02.22 # means Feb 23 2022
17/02/2022 # means Feb 17 2022
18.2.22 # means Feb 18 2022
2/22/2022 # means Feb 22 2022
3/1/2022 # means March 1 2022
<more messy different format>
uj5u.com熱心網友回復:
將日期強制為 datetime 并允許將無效條目轉換為 null。此外,允許 pandas 推斷格式。下面的代碼
df['date'] = pd.to_datetime(df['date'], errors='coerce',infer_datetime_format=True)
date
0 2022-02-17
1 2022-02-23
2 2022-02-17
3 2022-02-18
4 2022-02-22
5 2022-03-01
uj5u.com熱心網友回復:
基于 wwnde 的解決方案,以下作業在我的真實資料集中 -
df['date'].fillna('',inplace=True)
df['date'] = df['date'].astype('str')
df['date new'] = df['date'].str.replace('.','/')
df['date new'] = pd.to_datetime(df['date new'],
errors='coerce',infer_datetime_format=True)
轉載請註明出處,本文鏈接:https://www.uj5u.com/shujuku/435899.html
上一篇:選擇最低日期,但大于其他日期
