我有一個要讀取到資料框的日志檔案,但是兩個物件之間沒有分隔符。
Country|ID|Item_IDCountry|ID|Item_IDCountry|ID|Item_IDCountry|ID|Item_ID
在這種格式中,Country 是嚴格的 2 字符字串。
我試圖弄清楚如何在 python 中做到這一點,因為我還是一個初學者。任何幫助將非常感激
我嘗試了 read_csv 但失敗了,我試圖在網上尋找答案但沒有找到太多
uj5u.com熱心網友回復:
該格式的分隔符是|,假設有問題的日志檔案的名稱是logs.csv:
import pandas
logs = []
with open("logs.csv") as f:
lines = f.readlines()
column_names = lines[0].rstrip('\n').split("|")
for l in lines[1:]:
logs.append(l.rstrip('\n').split("|"))
df = pandas.DataFrame(logs, columns=column_names)
print(df)
lines[0].rstrip('\n').split("|")基本上從第一行中洗掉換行符并將列名 ( Country|ID|Item_IDCountry|ID|Item_IDCountry|ID|Item_IDCountry|ID|Item_ID) 轉換為串列。
for l in lines[1:]:遍歷日志檔案中的所有行,從第二行開始。
轉載請註明出處,本文鏈接:https://www.uj5u.com/caozuo/450505.html
