我有一個csv檔案,在1行(或更多)有一個額外的值,與第一行的標題不一致
。例子:
姓名、年齡、性別
abc,20,m
def,28,f
ghi,36,f
jkl,23,f,a
xyz,30,m
我想在Pandas Dataframe中加載這個資料集,那么我如何用Python洗掉這個值呢? 因為原始檔案的大小,普通的文本/表格工具無法加載所有的行
df = pd.read_csv(data,delimiter=',')/code>
ParserError。對資料進行標記時出錯。C錯誤。在第26398行預計有166個欄位,看到的是167個
uj5u.com熱心網友回復:
示例csv
姓名、年齡、性別
abc,20,m
def,28,f
ghi,36,f
jkl,23,f,a
xyz,30,m
python代碼--使用usecols的pandas.read_csv引數。
import pandas as pd
df = pd.read_csv('sample. csv', usecols=[0, 1, 2]) #或usecols=['name', 'age', 'gender']
print(df)
輸出
name age gender
0 abc 20 m
1 def 28 f
2 ghi 36 f
3 jkl 23 f
4 xyz 30 m
轉載請註明出處,本文鏈接:https://www.uj5u.com/houduan/324452.html
標籤:
下一篇:以特定方式更改給定字串的順序
