我需要資料清理方面的幫助。如何將語言列(D)變成列(F)中的形式基本上只是去掉括號和撇號,并保存每種語言之間的逗號。可以使用python或excel本身完成謝謝!
我試圖谷歌,但它沒有作業
uj5u.com熱心網友回復:
您可以使用 pandas 將 csv 讀入資料框,然后將函式“應用”到執行以下操作的列:
def clean(value: str) -> str:
for c in "[']":
value = value.replace(c, "")
return value
值得注意的是,如果您洗掉括號,您將擁有一個“嵌入式”分隔符,這意味著您將無法將其保存為“csv”而不會感到頭疼。
如果你想在 Excel 中清理它,你可以,類似于我上面的公式,添加一個公式,用空字串替換所有不需要的字符,如下所示:
=SUBSTITUTE(SUBSTITUTE(SUBSTITUTE(D2,"'",""),"[",""),"]","")
*其中 D2 是第一個語言單元格
FWIW,我也會花幾分鐘在 pandas 中玩這個——學習新技能總是好的
uj5u.com熱心網友回復:
根據影像,“D”列中的資料型別似乎是元素串列,因此當寫入單元格時,方括號被包括在內。
他們是一個簡單的技巧來處理這個問題:當你遍歷列和行(基本上是單元格)時,只需運行一個連接前面的串列理解,如下所示
''.join[_val for _val in str(_cell_val) if str(_val) not in ['[', ']', '\'']
使用串列推導搜索串列到 str 的轉換,您應該有足夠的樣本。
轉載請註明出處,本文鏈接:https://www.uj5u.com/net/451467.html
