我正在嘗試將大型資料集(660k 行)的列轉換為 Jupyter 筆記本中的日期時間型別。我找到了兩種方法:
pd.to_datetime(df['local_time'],format='%d/%m/%Y')
df['local_time'].astype("datetime64[ns]")
但他們甚至在幾個小時內都沒有完成。有沒有辦法讓它更快?看起來筆記本電腦的任何資源都不會被 100% 使用。我的筆記本電腦是宏碁 S7。Intel(R) Core(TM) i7-5500U CPU @ 2.40GHz。記憶體 8Gb
uj5u.com熱心網友回復:
我不確定背后的原因是什么,但我一次轉換多列并且時間增加了很多很多倍。
df[['date_1', 'date_2', 'date_3', 'date_4']] = df[['date_1', 'date_2', 'date_3', 'date_4']].astype('datetime64[ns]')
在分步完成所有事情之后,時間變得體面
df['date_1'] = df['date_1'].astype('datetime64[ns]')
df['date_2'] = df['date_2'].astype('datetime64[ns]')
df['date_3'] = df['date_3'].astype('datetime64[ns]')
df['date_4'] = df['date_4'].astype('datetime64[ns]')
轉載請註明出處,本文鏈接:https://www.uj5u.com/qukuanlian/537306.html
