我有一個像這樣的熊貓資料框:
column1 | column2 | column3
1 | 4 | 10.4
4 | 7 | 11.1
3 | 3 | 3.3
我怎樣才能計算整個列的平方值的總和(我正在嘗試類似deviation = df[columnName].pow(2).sum()回圈的方法,但非常歡迎想法!)但之后還要確定具有最小總和和實際最小總和的列?
編輯:添加所需的輸出
在這種情況下所需的輸出是:
Minimum sum of squared values: 26
Column containing minimum sum of squared values: column1
uj5u.com熱心網友回復:
您可以計算整個資料框的平方和,它回傳一個以列名作為索引的 Series 物件。然后您可以使用minand找到最小值和最小索引idxmin:
col_squares = df.pow(2).sum()
col_squares
#column1 26.00
#column2 74.00
#column3 242.26
#dtype: float64
col_squares.min(), col_squares.idxmin()
#(26.0, 'column1')
uj5u.com熱心網友回復:
獲得相同結果的更簡單/易于理解的方法如下
def minimum_square_sum_col(col):
sums = 0
for i in col:
sums = i**2
return sums
col_to_sum_dict = dict(df.apply(minimum_square_sum_col))
print(col_to_sum_dict)
轉載請註明出處,本文鏈接:https://www.uj5u.com/houduan/392635.html
