我正在分析csv檔案中的資料,這些資料按日期和時間列(Sdate)排序,如下所示(注意:這都是一列)。 Sdate 01/01/2016 00:00 01/01/2016 01:00 01/01/2016 02:00 等等
。然而,當要分析的資料被分割成15分鐘的間隔時。下面是一個例子:
日期 01/01/2016 00:00 01/01/2016 00:15 01/01/2016 00:30 等等
然后輸出似乎每小時對我的資料進行分組,并且在繼續進行時也會錯過資料。
目前,我正在讀取目錄中的所有 csv 檔案并對它們進行排序。我使用了pd.to_datetime函式,它對每小時的間隔有效,但對15分鐘的間隔無效:
for file_ in allFiles:
df = df = pd.read_csv(file_,index_col=None, header=0, low_memory=False)
df['Sdate'] = pd.to_datetime(df['Sdate'] )
df.reset_index()
list_.append(df)
有誰知道這是否是pd.to_datetime的問題,還是可能是我對內容進行分組的方式的問題,請看下面的內容:
hourly = grouped.aggregation(np.sum).reset_index()
如果能得到任何幫助,我們將不勝感激。謝謝你!
uj5u.com熱心網友回復:
Pandas解決這個問題的方法 pandas.read_csv()函式有一個關鍵字引數,叫做parse_dates
使用這個引數,你可以使用默認的date_parser(dateutil.parser.parser)將字串、浮點或整數轉換為資料時間
。pd.read_csv(file, header=None, names=headers, dtype=dtypes, parse_dates='Sdate'/span>)
轉載請註明出處,本文鏈接:https://www.uj5u.com/ruanti/328049.html
標籤:
上一篇:漫畫:什么是 “時間管理” ?
下一篇:03 JavaSE—程式邏輯控制
