我正在尋找具有最大值的資料框列,并將這個變數名分配給一個新變數。這里的一個類似示例在資料框設定中沒有回答這個問題。請參見下面的示例:
import pandas as pd
data = {'A': [1, 2, 2, 0], 'B':[2, 0, 2, 1]}
df = pd.DataFrame(data)
我正在尋找創建一個變數df['C'] = [B, A, [A, B], B]。
uj5u.com熱心網友回復:
你可以把它分成幾行,但我想就是這樣:
df["C"] = df.apply(lambda x: "A, B" if x.A == x.B == max(x.A, x.B) else "A" if x.A == max(x.A, x.B) else "B", axis=1)
這會給你
A B C
0 1 2 B
1 2 0 A
2 2 2 A, B
3 0 1 B
uj5u.com熱心網友回復:
使用max第二軸和返工資料框來選擇匹配的每行最大的列:
# get max value per row and identify matching cells
m = df.eq(df.max(axis=1), axis=0)
# mask and reshape to 1D (removes the non matches)
s = m.where(m).stack()
# aggregate to produce the final result
df['C'] = (s.index.get_level_values(1)
.to_series()
.groupby(s.index.get_level_values(0))
.apply(list)
)
輸出:
A B C
0 1 2 [B]
1 2 0 [A]
2 2 2 [A, B]
3 0 1 [B]
轉載請註明出處,本文鏈接:https://www.uj5u.com/net/409473.html
標籤:
