我無法準確理解這段代碼是如何作業的。
在第133頁有一個例子,我只能部分地理解。
library(tidyverse)
library(nycflights13)
航班%>%。
group_by(month, carrier) %>%
summarise(n=n() %> % ##sum of items;
group_by(month) %> %
mutate(prop=scales:: 百分比(n/sum(n))。 n=NULL) %> %
差價(月,道具)
航班%>%。
group_by(month, carrier) %>% ## This is grouping by months and within the months by carrier; //span>
summarise(n=n() %> % ##它在對專案進行求和,給出每個月和每個載體的專案之和; %>
在這一點上,在另一個group_by()中,它看起來像一個嵌套到group_by(month, carrier)
然后:
mutate(prop=scales:: 百分比(n/sum(n))。 n=NULL) %> % ##計算專案超過總數的百分比,并將其存盤在 "prop"
最后一行,它創建了矩陣,在列中放入month,在里面放入從prop
我想更好地了解第二個group_by(month) %>%
提前感謝您的每一個回答。
uj5u.com熱心網友回復:
這里不需要第二個group_by,因為默認的summarise步驟引數.groups = "drop_last"。 因此,在第一個summarise之后,只剩下一個分組列,即 "月"。 我們可以將代碼改為
flights %>%
group_by(month, carrier) %>%
summarise(n=n() %> %
mutate(prop=scales:: 百分比(n/sum(n))。 n=NULL)
假設,我們將.groups中的默認值改為 "drop",那么,它將放棄所有的分組變數,因此需要一個新的group_by陳述句。 另外,在最后一個分組陳述句之后,如果我們使用mutate,它不會放棄分組屬性,因此ungroup將是有用的
flights %>%
group_by(month, carrier) %>%
summarise(n=n(), 。 groups = "drop") %>% 。
group_by(month) %>%
mutate(prop=scales:: 百分比(n/sum(n))。 n=NULL) %> %
解除組
轉載請註明出處,本文鏈接:https://www.uj5u.com/qukuanlian/334049.html
標籤:
下一篇:如何自動填入空白欄
