Cluster Class Value
0 0 10 1
1 0 11 1
2 0 14 3
3 0 18 1
4 0 26 1
5 0 29 1
6 0 30 1
7 1 0 2
8 1 19 1
9 1 20 1
10 1 21 2
11 1 36 1
12 1 26 1
13 1 27 1
14 1 37 2
15 1 33 1
該表基于哪個類屬于哪個集群。像 Class 10, 11, 14 等已經落入 Cluster 0。并且 Value 串列示有多少類成員。像 14 班的 3 名成員已落入集群 0。
現在我想要的輸出是這樣的:
Cluster Class Value Cluster_Sum
0 0 10 1 9
1 0 11 1 9
2 0 14 3 9
3 0 18 1 9
4 0 26 1 9
5 0 29 1 9
6 0 30 1 9
其他集群也一樣。我的最終目標是
df['Precision'] = df['Value']/ df['Cluster_Sum'] 為每一行制作一個“精確”列。
我怎樣才能使用python做到這一點?
編輯: - 它作業得很好。謝謝你的幫助。
最終這是我的目標。每個班級的人數都是固定的。像 Class 1 : 10 , Class 2:12 .... 等等。我需要添加一個像 'Class_Sum. 其中包括班級總數的資料。然后我可以通過以下方式找到召回
`df['Recall'] = df['Value']/ df['Class_Sum']`
但我的問題是如何附加我的資訊
Class 1 10
Class 2 12
Class 3 23
Class 4 11
Class 5 17
Class 6 13
Class 7 16
Class 8 15
Class 9 14
Class 10 18
Class 11 09
Class 12 07
Class 13 16
Class 14 21
Class 15 17
Class 16 23
Class 17 10
Class 18 21
Class 19 12
Class 20 45
Class 21 12
Class 22 12
Class 23 15
Class 24 11
Class 25 09
Class 26 11
Class 27 08
Class 28 10
Class 29 11
Class 30 19
Class 31 17
Class 32 15
Class 33 12
Class 34 07
Class 35 06
Class 36 14
Class 37 13
Class 38 16
像這樣到我的資料框
Cluster Class Class_SUm Value ClusSum Precision RCll
10 18
11 09
14 21
18 21
26 11
29 11
30 19
如何做呢?
uj5u.com熱心網友回復:
嘗試groupby:
df["Cluster_Sum"] = df.groupby("Cluster")["Value"].transform("sum")
>>> df
Cluster Class Value Cluster_Sum
0 0 10 1 9
1 0 11 1 9
2 0 14 3 9
3 0 18 1 9
4 0 26 1 9
5 0 29 1 9
6 0 30 1 9
7 1 0 2 12
8 1 19 1 12
9 1 20 1 12
10 1 21 2 12
11 1 36 1 12
12 1 26 1 12
13 1 27 1 12
14 1 37 2 12
15 1 33 1 12
uj5u.com熱心網友回復:
groupby transform("sum")是你的朋友:
df['Precision'] = df["Value"] / df.groupby("Cluster")["Value"].transform("sum")
輸出:
>>> df
Cluster Class Value Precision
0 0 10 1 0.111111
1 0 11 1 0.111111
2 0 14 3 0.333333
3 0 18 1 0.111111
4 0 26 1 0.111111
5 0 29 1 0.111111
6 0 30 1 0.111111
7 1 0 2 0.166667
8 1 19 1 0.083333
9 1 20 1 0.083333
10 1 21 2 0.166667
11 1 36 1 0.083333
12 1 26 1 0.083333
13 1 27 1 0.083333
14 1 37 2 0.166667
15 1 33 1 0.083333
轉載請註明出處,本文鏈接:https://www.uj5u.com/gongcheng/441255.html
上一篇:替換資料框中所有出現的列
