我希望創建一個匯總表。
例如,資料集df是這樣的:
type category color
bmw a 黑色
bmw b 黑色
bmw c 白色
寶馬D黑色
bmw e 白
.....
基本上,type將是整個資料集的相同值,而category將是所有唯一的值。我想做的是計算出顏色的比例。因此,我希望得到一個類似這樣的輸出結果:
color count prop
黑色 48 0.34
白色 62 0.52
灰色 20 ...
.....
請注意,上面的數字和比例都是編造的,不是按比例的,只是為了說明問題。
在R中,我所要做的就是使用dplyr并使用summarise函式來輸出所需的結果,但不確定如何在SQL中進行操作。
我試著做了以下代碼:
SELECT type, category, color, count(*)
FROM df
然而,它給了我一個錯誤。
uj5u.com熱心網友回復:
你可以使用聚合和視窗函式:
select color, count(*)。
count(*) * 1. 0 / sum(count(*) over ()
from df
group by color。
轉載請註明出處,本文鏈接:https://www.uj5u.com/ruanti/332000.html
標籤:
