我有一個多索引資料框,例如:
df = pd.DataFrame(np.random.randn(4,2), index=pd.MultiIndex.from_tuples([(1900, 'elem1'), (1900, 'elem2'), (1901, 'elem1'), (1901, 'elem2')]),
columns=['col1', 'col2'])
df.index.names=['y', 'elem']
df
col1 col2
y elem
1900 elem1 0.590143 -0.050658
elem2 0.208803 1.739487
1901 elem1 -2.336184 0.151083
elem2 -0.217127 -0.511950
我試圖將 1900 和 1901 之間的差異作為資料幀的一部分,如下所示:
col1 col2
y elem
1900 elem1 0.590143 -0.050658
elem2 0.208803 1.739487
1901 elem1 -2.336184 0.151083
elem2 -0.217127 -0.511950
diff elem1 -2.926327 0.201741
elem2 -0.42593 -2.251437
任何建議我如何存檔此任務?非常感謝您的幫助!
uj5u.com熱心網友回復:
從 1901 中減去 1900,將 附加diff到索引并連接回主 df:
temp = (df.loc[1901]
.sub(df.loc[1900], axis = 0)
.set_index([['diff', 'diff']], append = True)
.swaplevel()
)
pd.concat([df, temp])
轉載請註明出處,本文鏈接:https://www.uj5u.com/qiye/371462.html
上一篇:根據分組創建一個pandas列
