我有 2 個熊貓資料框(dfA、dfB),每個資料框有 2 列(性別、名字)。dfA 是要通過在 dfB 中尋找正確值來清理的資料(錯誤的名字/性別)。下面是我的代碼,它可以作業,但對于數百萬條資料來說非常慢。有沒有辦法更快地做到這一點?(不使用資料庫或其他)謝謝
for rowIndex in range(len(dfA)):
firstname = dfA.loc[rowIndex,'firstname']
try:
dfA.loc[rowIndex,'genderNew'] = dfB.loc[dfB['firstname'] == firstname].gender.values[0]
except Exception as e:
dfA.loc[rowIndex,'genderNew'] = "unknown"
uj5u.com熱心網友回復:
這應該可以更有效地完成作業:
dfA.merge(dfB, on='firstname', how='left').fillna('unknown')
轉載請註明出處,本文鏈接:https://www.uj5u.com/qiye/353865.html
