鑒于我有以下資料表:
total_sales tickets_sold show_time occu_perc ticket_price DATE
1: 3900000 26 4 4.26 150000 2018-05-05
2: 3360000 42 5 8.08 80000 2018-05-05
3: 2560000 32 4 20.00 80000 2018-05-05
4: 1200000 12 1 11.01 100000 2018-05-05
5: 1200000 15 3 16.67 80000 2018-05-05
6: 1050000 7 3 0.98 150000 2018-05-05
資料包括每日銷售額、售出門票數量等。我打算將除 DATE 變數以外的所有變數轉換為時間序列以進行多變數分析。但是,我想將條目轉換為每月總平均值,例如,平均每月顯示時間。我該怎么做?
uj5u.com熱心網友回復:
從DATE可以提取年份和月份值和匯總每個月的變數,并回傳mean。
library(dplyr)
df %>%
mutate(DATE = as.Date(DATE),
ym = format(DATE, '%Y-%m')) %>%
group_by(ym) %>%
summarise(across(total_sales:ticket_price, mean, na.rm = TRUE))
轉載請註明出處,本文鏈接:https://www.uj5u.com/houduan/396843.html
