我有一個 CSV 檔案,其中包含一個對用戶不友好的列資料。我需要將這些資料轉換成有意義的東西。簡單的查找/替換看起來很笨重,因為我想要翻譯的可能組合有幾十種甚至上百種。
例如:BLK = 黑色或 MNT TP = 山頂
可能有數十種甚至數百種翻譯 - 我已經在 CSV 表中提供了很多。問題是如何使用該字典來更改另一個 CSV 表中的值。同樣重要的是要注意,這(最終)需要每隔幾分鐘自行運行一次 - 而不僅僅是一次翻譯。
uj5u.com熱心網友回復:
如果您能更詳細地描述您正在處理的資料,那就太好了。不過我會盡力猜測。
假設您有一個 CSV 檔案,用于pandas將其讀入名為 的資料框df,以及名為col. 要替換 column 中的所有值col,首先,您需要一個包含所有鍵(原始文本)和值(新文本)的字典:
my_dict = {"BLK": "Black", "MNT TP": Mountain Top,...}
然后,將字典映射到列:
df["col"] = df["col"].map(lambda x: my_dict.get(x, x))
如果某個鍵出現在字典中,則將其替換為字典中對應的新值,否則保留原值。
轉載請註明出處,本文鏈接:https://www.uj5u.com/net/400931.html
上一篇:我如何將3個div居中在一個div中,中間有一個空格
下一篇:如何更新兩個單獨串列中的字典?
