我有一個資料框架,看起來像這樣的
。每一行都有自己的副本,前綴為'treatment_group',但有不同的系數。 我如何在整個資料框架中使用以下邏輯將這些行按系數相加:sum = treatment_group: feature 19 feature 19?
uj5u.com熱心網友回復:
你可以使用split來選擇最后一個值,它對任何帶有聚合sum的值都有效:
df.groupby(df.index.str. split(':').str[-1])。sum()
或者使用replace:
df.groupby(df.index.str. replace('treatment_group:', '', regex=True).sum()
就像評論中提到的@mozway - 可以提取索引中的最后一個數字(為回傳Series添加expand=False):
df.groupby(df.index.str. extract('(d )$', expand=False).sum()
uj5u.com熱心網友回復:
只要做:
df.groupby(df.index.str.extract('(d )$')).sum()
轉載請註明出處,本文鏈接:https://www.uj5u.com/houduan/326403.html
標籤:

