我有兩個資料框,我可以通過pd.merge(df1, df2, on='column_name'). 但我只想在df1任何指標或解決方案中第一次出現時合并?這是多對一的,我只想合并第一次出現。提前致謝!
uj5u.com熱心網友回復:
由于您想要合并兩個不同長度的資料幀,因此您必須NaN在合并的資料幀單元格中有值,而df2. 所以讓我們試試這個。合并左。這將復制df2中重復column_name行的值df1。準備一個掩碼來過濾這些行并NaN在df2.
mask = df1['column_name'].duplicated()
new_df = df1.merge(df2, how='left', on='column_name')
new_df.loc[mask, df2.columns[df2.columns!='column_name']] = np.nan
轉載請註明出處,本文鏈接:https://www.uj5u.com/ruanti/383781.html
