我有一個龐大的資料集,超過 1,000,000 行。我想看看有多少“xCordAdjusted”、“yCordAdjusted”配對與“事件”型別“SHOT”、“MISS”和“GOAL”相關。
“xCordAdjusted”的最小值為 0,最大值為 100,“yCordAdjusted”的最小值為 -44,最大值為 44。
dff.head()
season event xCordAdjusted yCordAdjusted
2020 SHOT 74 -29
2020 SHOT 49 -25
2020 SHOT 52 31
2020 SHOT 43 39
2020 MISS 46 -33
我想看到每個坐標的頻率導致三個“事件”屬性可能性“SHOT”、“MISS”、“GOAL”。不一定要準確 - 我只想能夠根據每個“事件”的 x、y 線頻率對它們的總數進行進一步分析。
期望的輸出:
xCordAdjusted yCordAdjusted event total
100 -44 SHOT 500,xxx
MISS 500,xxx
GOAL 500,xxx
99 -44 SHOT 500,xxx
MISS 500,xxx
GOAL 500,xxx
uj5u.com熱心網友回復:
由于您希望通過 x 和 y 坐標來總結每種型別事件的數量,因此您可以使用groupbyand sum:
dff.groupby(['xCordAdjusted','yCordAdjusted','event']).sum()
轉載請註明出處,本文鏈接:https://www.uj5u.com/gongcheng/397669.html
上一篇:在條件下填充熊貓細胞的有效方法
