合并期間僅向第一個組合添加值-有解無憂

我有兩個dfs：

df_1

date            id          value
2021-01-01      A1          100
2021-01-01      A1          200
2021-01-01      A1          300
2021-01-02      A1          100
2021-01-02      A1          200
2021-01-03      A1          500
2021-01-03      A1          800

df_2

date            id          value_to_add
2021-01-01      A1          150 
2021-01-03      A1          350

我試圖在合并期間保持結構df_1并在第一次出現時添加，value_to_add以便在填充后最終結果看起來像這樣，NaN除了第一個值之外的所有值都帶有 a 0：

date            id          value       value_to_add
2021-01-01      A1          100         150 
2021-01-01      A1          200         0               # 0 because the 150 have been already added
2021-01-01      A1          300         0
2021-01-02      A1          100         0               # 0 because value_to_add does not exist
2021-01-02      A1          200         0
2021-01-03      A1          500         350 
2021-01-03      A1          800         0               # 0 because the 350 have been already added

我的第一個想法是洗掉一個['date', 'id']子集的重復項，然后合并df_2到它，但是我不確定如何回到df_1.

所以問題是以下 -能夠在操作期間第一次出現鍵時進行pd.merge合并。我無法找到有關此主題的任何內容，坦率地說，我不確定如何實作這一目標。

uj5u.com熱心網友回復：

您可以DataFrame.duplicated使用反轉掩碼過濾重復值，并Index.union避免洗掉從以下位置添加的新列merge：

df_1.loc[~df_1.duplicated(['date', 'id']),
         df_1.columns.union(df_2.columns)] = df_1.merge(df_2, how='left')
df_1 = df_1.fillna(0)
print (df_1)
         date  id  value  value_to_add
0  2021-01-01  A1    100         150.0
1  2021-01-01  A1    200           0.0
2  2021-01-01  A1    300           0.0
3  2021-01-02  A1    100           0.0
4  2021-01-02  A1    200           0.0
5  2021-01-03  A1    500         350.0
6  2021-01-03  A1    800           0.0

輔助計數器列的另一個想法：

df_1 = df_1.assign(g = df_1.groupby(['date', 'id']).cumcount()).merge(df_2.assign(g=0), how='left')
df_1 = df_1.drop('g', 1).fillna(0)
print (df_1)
         date  id  value  value_to_add
0  2021-01-01  A1    100         150.0
1  2021-01-01  A1    200           0.0
2  2021-01-01  A1    300           0.0
3  2021-01-02  A1    100           0.0
4  2021-01-02  A1    200           0.0
5  2021-01-03  A1    500         350.0
6  2021-01-03  A1    800           0.0

uj5u.com熱心網友回復：

s =df_1.set_index(['date','id']).join(df_2.set_index(['date','id']))

s=s.assign(value_to_add=np.where(~s['value_to_add'].duplicated(keep='first'),s['value_to_add'],np.nan)).fillna(0)

轉載請註明出處，本文鏈接：https://www.uj5u.com/shujuku/459189.html

標籤：Python 熊猫合并

上一篇：是否可以使用pythonpandas通過回圈構建投資組合？

下一篇：在pandas中以固定列比率進行采樣