我有以下df:
df = data.frame(id=c(1,1,1,1,1,1),
date=c(as.Date("2000-01-01"), as.Date("2000-07-11"),
as.Date("2000-08-01"), as.Date("2000-12-31"),
as.Date("2002-05-04"), as.Date("2002-06-01")))
我需要以下結果:
result = data.frame(id=c(1,1,1,1,1,1),
date=c(as.Date("2000-01-01"), as.Date("2000-07-11"),
as.Date("2000-08-01"), as.Date("2000-12-31"),
as.Date("2002-05-04"), as.Date("2002-06-01")),
days_91 = c(0,0,1,0,0,1),
days_182 = c(0,0,1,0,0,1),
days_273 = c(0,1,1,1,0,1),
days_365 = c(0,1,1,1,0,1))
基本上,對于某個日期,我想知道在過去 X 天內是否存在相同 ID 的先前日期。
我認為必須存在潤滑功能,但沒有找到。
結果:
| ID | 日期 | days_91 | 天_182 | days_273 | days_365 |
|---|---|---|---|---|---|
| 1 | 2000-01-01 | 0 | 0 | 0 | 0 |
| 1 | 2000-07-11 | 0 | 0 | 1 | 1 |
| 1 | 2000-08-01 | 1 | 1 | 1 | 1 |
| 1 | 2000-12-31 | 0 | 1 | 1 | 1 |
| 1 | 2002-05-04 | 0 | 0 | 0 | 0 |
| 1 | 2002-06-01 | 1 | 1 | 1 | 1 |
例如,對于第 3 行,在過去 91、182、273 和 365 天中有一個前一個日期。然而,在第 2 行中,過去 91 天和 182 天沒有以前的訪問
uj5u.com熱心網友回復:
這是另一個使用map2and map_dfcfrom 的選項purrr。在提供給定date和前一個date(按排序順序)后,您可以將這兩個值的差異與數字向量中的所有元素(包含天數,例如 91、182 等)進行比較。
library(tidyverse)
my_days <- c(91, 182, 273, 365)
df %>%
group_by(id) %>%
arrange(date, .by_group = T) %>%
mutate(days = map2(
date,
lag(date, default = as.Date(-Inf)),
\(x, y) {
bind_cols(map_dfc(set_names(my_days, paste0("days_", my_days)), ~ (x - y < .x)))
}
)) %>%
unnest(days)
輸出
id date days_91 days_182 days_273 days_365
<dbl> <date> <int> <int> <int> <int>
1 1 2000-01-01 0 0 0 0
2 1 2000-07-11 0 0 1 1
3 1 2000-08-01 1 1 1 1
4 1 2000-12-31 0 1 1 1
5 1 2002-05-04 0 0 0 0
6 1 2002-06-01 1 1 1 1
uj5u.com熱心網友回復:
我們可以使用 dplyr 遍歷您要檢查的日期串列,如果“日期”列中的任何日期在前 x 天記憶體在,則將回傳 1:
library(dplyr)
dates_check <- c(91, 192, 213, 365) # Dates we want to check
prev_dates <- function(prev_date){
colname <- paste('days_', prev_date, sep='') # Dynamically create the column name
df <<- df %>%
group_by(id) %>% # Group our data by id
rowwise() %>% # Perform rowwise operation
mutate(!!colname := as.integer(any(df$date > date - prev_date & df$date < date)))
}
lapply(dates_check, prev_dates)
# A tibble: 6 x 6
# Rowwise: id
id date days_91 days_182 days_273 days_365
<dbl> <date> <int> <int> <int> <int>
1 1 2000-01-01 0 0 0 0
2 1 2000-07-11 0 0 1 1
3 1 2000-08-01 1 1 1 1
4 1 2000-12-31 0 1 1 1
5 1 2002-05-04 0 0 0 0
6 1 2002-06-01 1 1 1 1
轉載請註明出處,本文鏈接:https://www.uj5u.com/yidong/409156.html
標籤:
