這個腳本讀入一個 txt 檔案并創建一個 df,但我想處理可能被 1 個或更多空格分隔的值,所以當我運行上面的腳本時,我得到了許多帶有 NaN 的列。
代碼:
df = pd.read_csv(data_file,header = None, sep=' ')
示例txt檔案
blah blahh bl
blah3 blahhe ble
我希望只有 3 列,所以我得到
Col_a col_b col_c
blah blahh bl
blah3 blahhe ble
uj5u.com熱心網友回復:
您可以使用正則運算式作為分隔符:
pd.read_csv(data_file, header=None, delimiter=r"\s ", names='Col_a Col_b Col_c'.split(' '))
或者你可以使用delim_whitespace=True引數,它比正則運算式快:
pd.read_csv(data_file, header=None, delim_whitespace=True, names='Col_a Col_b Col_c'.split(' '))
參考:如何在 Pandas 中讀取帶有空格分隔值的檔案
轉載請註明出處,本文鏈接:https://www.uj5u.com/ruanti/399113.html
