這是一個樣本資料
ao112 qwertyuiopasdfgh
ao12234 isbcbcobcwocbwowd
ao12 lscnldcnoodqhiod
我想使用 .txt 檔案創建一個資料框,其中資料框需要在此示例中創建單獨的列(2 列),使用此資訊列名稱 | 位置代碼 |1-7 空白 |8 描述|9- 到結尾我需要通過在示例案例中的特定位置分隔來創建資料框列,即在空白位置
嘗試使用此代碼,但無法找到我應該在 sep 中使用什么引數
data=pd.read_csv('filepath',sep=' ',name=['code','description'])
uj5u.com熱心網友回復:
您可以使用pandas.read_fwf:
colspecs='infer'您可以使用或提供范圍的完整串列來推斷格式。
元組 (int, int) 或“推斷”的 colspecslist。選修的
一個元組串列,將每行的固定寬度欄位的范圍作為半開間隔(即 [from, to[ )。字串值 'infer' 可用于指示決議器嘗試從資料的前 100 行中檢測未通過 skiprows 跳過的列規范(默認 ='infer')。
(pd.read_fwf('filepath', colspecs='infer', header=None)
.set_axis(['code','description'], axis=1)
)
或者,使用正則運算式分隔符pandas.read_csv(如果您有一個或多個空格作為分隔符):
pd.read_csv('filepath', sep='\s ', names=['code','description'])
輸出:
code description
0 ao112 qwertyuiopasdfgh
1 ao12234 isbcbcobcwocbwowd
2 ao12 lscnldcnoodqhiod
轉載請註明出處,本文鏈接:https://www.uj5u.com/houduan/476872.html
