我正在嘗試格式化以下資料框(可以將其復制到剪貼板并由 pd 讀取):

給定字典,其中每個country都有一個替代名稱串列,我試圖用country更新值的重復行來“分解”值。更新國家名稱的字典:
{
'UAE':['United Arab Emirates', 'UAE'],
'Rep of Tunisia': ['Tunisia','Rep of Tunisia']
}
期望的結果:

這似乎是一件容易的事情,但我堅持,任何幫助表示贊賞。
uj5u.com熱心網友回復:
你可以map你的字典,然后explode:
out = (df.assign(country=df['country'].map(country_names))
.explode('country', ignore_index=True)
)
輸出:
country period
0 United Arab Emirates 2022-01-01
1 UAE 2022-01-01
2 Tunisia 2022-10-01
3 Rep of Tunisia 2022-10-01
轉載請註明出處,本文鏈接:https://www.uj5u.com/qiye/517071.html
標籤:Python熊猫数据框
上一篇:如何使用rake任務檢查狀態
