我有一個帶有以下時間戳的文本檔案:
0:01
0:02
0:02
0:02
0:03
...
2:05:52
2:05:52
2:05:52
2:05:53
2:05:53
2:05:53
2:05:53
2:05:54
2:05:54
2:05:54
2:05:54
目前,我設定了一個字典來計算每個實體并計算它們。輸出 [2:05:54, 4]。這是偉大的,所有的,并且排名最高。但是,我注意到的一個問題是,如果我不按某種間隔對它們進行分組,則 30 秒的片段將占用所有空間。我可以在理論上和目前,時間戳 1:00 - 1:30 占用所有空間。這就是為什么我想以某種間隔對它們進行分組,希望與熊貓一起?我從 Pandas 看到的是我需要在 MM-DD-YYYY TIMESTAMP 中擁有它,這是我無法做到的。
uj5u.com熱心網友回復:
首先,您需要清理資料。我不知道“0:01”是指午夜后 1 秒還是 1 分鐘后,Pandas 也不知道。酌情將其寫為“0:00:01”或“0:01:00”。然后試試這個:
df = pd.read_table('mydata.txt', header=None)
df.index = pd.to_timedelta(df[0]) # convert from strings
df.resample('1 min').count()
輸出是:
0
0
00:00:01 5
00:01:01 0
00:02:01 0
00:03:01 0
00:04:01 0
... ..
02:01:01 0
02:02:01 0
02:03:01 0
02:04:01 0
02:05:01 11
參考:https ://pandas.pydata.org/docs/reference/api/pandas.DataFrame.resample.html
轉載請註明出處,本文鏈接:https://www.uj5u.com/shujuku/443066.html
