致力于將 csv 檔案放入資料框并將其加載到資料庫中,但是有一些檔案在額外的列中包含帶有資料的行。我希望能夠洗掉超過“X”列的整行
例如,想要洗掉超過 4 列的行
id, header1, header2, header3
1, desc1, desc2, desc3
2, desc1, desc2, desc3
3, desc1, desc2, desc3, desc4
4, desc1, desc2, desc3
我想跳過 id = 3 的行,輸出:
id, header1, header2, header3
1, desc1, desc2, desc3
2, desc1, desc2, desc3
4, desc1, desc2, desc3
uj5u.com熱心網友回復:
Pandas 可以為您完成,on_bad_lines='skip'用作以下引數read_csv:
df = pd.read_csv('data.csv', on_bad_lines='skip')
print(df)
# Output
id header1 header2 header3
0 1 desc1 desc2 desc3
1 2 desc1 desc2 desc3
2 4 desc1 desc2 desc3
更新
對于舊版本的 Pandas,請使用:
df = pd.read_csv('data.csv', error_bad_lines=False)
print(df)
# Output
id header1 header2 header3
0 1 desc1 desc2 desc3
1 2 desc1 desc2 desc3
2 4 desc1 desc2 desc3
轉載請註明出處,本文鏈接:https://www.uj5u.com/net/439391.html
