首先,我想指出,我在 stackoverflow 和 pandas 檔案中都沒有找到我的問題的答案,所以,如果之前有人問過這個問題,我會很感激這個帖子的鏈接。
我想按如下方式加入兩個 DataFrame。
df1 =
key x y z
0 x0 y0 z0
1 x1 y1 z1
...
10 x10 y10 z10
df2 =
key w v u
0 w0 v0 u0
0 w0 v0 u0
0 w0 v0 u0
1 w1 v1 u1
1 w1 v1 u1
2 w2 v2 u2
3 w3 v3 u3
...
10 w10 v10 u10
10 w10 v10 u10
想要的_df_output =
key x y z w v u
0 x0 y0 z0 w0 v0 u0
1 x1 y1 z1 w1 v1 u1
...
10 x10 y10 z10 w10 v10 u10
我試過這個df1.join(df2, how='inner', on='key'),但我得到這個錯誤:TypeError: object of type 'NoneType' has no len()。
謝謝
uj5u.com熱心網友回復:
它似乎df2有重復的值,所以如果你使用drop_duplicates方法洗掉它們并df1從右側合并,你會得到想要的結果。
out = df1.merge(df2.drop_duplicates(), on='key')
輸出:
key x y z w v u
0 0 x0 y0 z0 w0 v0 u0
1 1 x1 y1 z1 w1 v1 u1
2 10 x10 y10 z10 w10 v10 u10
uj5u.com熱心網友回復:
import pandas as pd
df1 = pd.DataFrame({'k':[0, 1, 2, 3],
'x':['x0', 'x1', 'x2', 'x3'],
'y':['y0', 'y1', 'y2', 'y3'],
'z':['z0', 'z1', 'z2', 'z3']
})
df1.set_index('k', inplace=True)
df2 = pd.DataFrame({'k':[0, 0, 0, 1, 1, 1],
'v':['v0', 'v0', 'v0','v1', 'v1', 'v1',],
'w':['w0', 'w0', 'w0','w1', 'w1', 'w1',],
'u':['u0', 'u0', 'u0','u1', 'u1', 'u1',]
})
df2.set_index('k', inplace=True)
df_merged = pd.merge(df1, df2.drop_duplicates(), how='inner', left_index=True, right_index=True)
df_merged
x y z v w u
k
0 x0 y0 z0 v0 w0 u0
1 x1 y1 z1 v1 w1 u1
轉載請註明出處,本文鏈接:https://www.uj5u.com/qiye/408278.html
標籤:
下一篇:等待回圈結束?
