我正在嘗試讀取包含一列資料的 csv 檔案,該資料列具有一個加擾的 ID 號,其中包括偶爾連續的 $$ 以及 #、數字和字母。
| SCRAMBLE_ID |
|---|
| AL9LLL677 |
| AL9$AM657 |
| $L9$$4440 |
| #L9$306A1 |
等等。
我嘗試了以下方法:
df = pd.read_csv('MASTER~1.CSV',
dtype = {'SCRAMBLE_ID': str})
它將第三個條目呈現為L9 $4440(L9 以襯線字體顯示,斜體,第一個和第二個 $ 消失)。
面對以這種方式配置的一整列 ID 號,處理此類資料的最佳方法是什么?我能想象:
- pd.read_csv 之前:用不會產生此問題的替代品(以及那些會是什么)替換有問題的符號,或者,
- 有沒有辦法按原樣保留 ID,但將它們變成忽略這些符號同時保持它們存在的資料型別?
謝謝你。我在下面附上了 .csv 的螢屏截圖和生成的 df(Jupyter 筆記本)。
用 $$ 將 csv 列轉換為 pandas df
uj5u.com熱心網友回復:
我無法在模擬 CSV 檔案中使用與您相同的值來復制它。
您確定在呈現資料幀值的任何地方都不會出現基于 $ 符號的格式嗎?您是否檢查過資料框中的資料是否符合您的預期,或者您是否只是在外部渲染它?
轉載請註明出處,本文鏈接:https://www.uj5u.com/qiye/433686.html
下一篇:用串列中的元素替換字串內部的前后
