填充/完成/按列展開-有解無憂

我有這個資料框：

df <- structure(list(lg0 = c(FALSE, FALSE, TRUE, TRUE, TRUE, TRUE, 
TRUE), lg2 = c(FALSE, TRUE, FALSE, FALSE, FALSE, FALSE, FALSE
), lg4 = c(TRUE, FALSE, FALSE, FALSE, FALSE, FALSE, FALSE), ld0 = c(TRUE, 
TRUE, TRUE, FALSE, FALSE, TRUE, FALSE), ld1 = c(FALSE, FALSE, 
FALSE, TRUE, FALSE, FALSE, TRUE), ld2 = c(FALSE, FALSE, FALSE, 
FALSE, TRUE, FALSE, FALSE), ld4 = c(FALSE, FALSE, FALSE, FALSE, 
FALSE, FALSE, FALSE)), class = "data.frame", row.names = c(NA, 
-7L))

    lg0   lg2   lg4   ld0   ld1   ld2   ld4
1 FALSE FALSE  TRUE  TRUE FALSE FALSE FALSE
2 FALSE  TRUE FALSE  TRUE FALSE FALSE FALSE
3  TRUE FALSE FALSE  TRUE FALSE FALSE FALSE
4  TRUE FALSE FALSE FALSE  TRUE FALSE FALSE
5  TRUE FALSE FALSE FALSE FALSE  TRUE FALSE
6  TRUE FALSE FALSE  TRUE FALSE FALSE FALSE
7  TRUE FALSE FALSE FALSE  TRUE FALSE FALSE

如何添加缺失的列lg1, lg3,ld3填充FALSE.

我想“準”完成/填充/擴展缺少的 COLUMNS 以獲得此：

這應該獨立于哪些列不存在，這可以改變。

期望輸出：

lg0   lg1   lg2   lg3   lg4   ld0   ld1   ld2   ld3   ld4  
FALSE FALSE FALSE FALSE TRUE  TRUE  FALSE FALSE FALSE FALSE
FALSE FALSE TRUE  FALSE FALSE TRUE  FALSE FALSE FALSE FALSE
TRUE  FALSE FALSE FALSE FALSE TRUE  FALSE FALSE FALSE FALSE
TRUE  FALSE FALSE FALSE FALSE FALSE TRUE  FALSE FALSE FALSE
TRUE  FALSE FALSE FALSE FALSE FALSE FALSE TRUE  FALSE FALSE
TRUE  FALSE FALSE FALSE FALSE TRUE  FALSE FALSE FALSE FALSE
TRUE  FALSE FALSE FALSE FALSE FALSE TRUE  FALSE FALSE FALSE

到目前為止，我已經嘗試過：

library(tidyr)
library(dplyr)
library(readr)

df2 <- df1 %>% 
  pivot_longer(
    everything()
  ) %>% 
  mutate(id = parse_number(name)) 

expand(df2, id, name)

uj5u.com熱心網友回復：

在中base R，我們可以構建一個新的資料集，FALSE并根據匹配的列名將 'df' 分配回它

nm1 <- paste0(rep(c("lg", "ld"), each = 5), 0:4)
df2 <- as.data.frame(matrix(FALSE, nrow = nrow(df), 
        ncol = length(nm1), dimnames = list(NULL, nm1)))
df2[names(df)] <- df

-輸出

> df2
    lg0   lg1   lg2   lg3   lg4   ld0   ld1   ld2   ld3   ld4
1 FALSE FALSE FALSE FALSE  TRUE  TRUE FALSE FALSE FALSE FALSE
2 FALSE FALSE  TRUE FALSE FALSE  TRUE FALSE FALSE FALSE FALSE
3  TRUE FALSE FALSE FALSE FALSE  TRUE FALSE FALSE FALSE FALSE
4  TRUE FALSE FALSE FALSE FALSE FALSE  TRUE FALSE FALSE FALSE
5  TRUE FALSE FALSE FALSE FALSE FALSE FALSE  TRUE FALSE FALSE
6  TRUE FALSE FALSE FALSE FALSE  TRUE FALSE FALSE FALSE FALSE
7  TRUE FALSE FALSE FALSE FALSE FALSE  TRUE FALSE FALSE FALSE

如果我們想自動構造 nm1

d1 <- as.numeric(sub("\\D ", "", names(df)))
nm1 <- c(t(outer(unique(sub("\\d ", "", names(df))),  
      min(d1):max(d1), FUN = paste0)))
df[setdiff(nm1, names(df))] <- FALSE
df[nm1]

uj5u.com熱心網友回復：

我認為您可以使用以下解決方案：

library(dplyr)
library(tidyr)

df %>%
  pivot_longer(everything()) %>% 
  extract(name, c("base", "pre"), regex = "(\\D )(\\d )") %>% 
  mutate(id = rep(1:ncol(df), each = ncol(df))) %>%
  group_by(id, base) %>%
  mutate(pre = as.integer(pre)) %>%
  complete(pre = seq(min(pre), max(pre), 1), fill = list(value = FALSE)) %>%
  unite("New_Name", c(base, pre), sep = "") %>%
  pivot_wider(names_from = New_Name, values_from = value) %>%
  ungroup() %>%
  select(-id) %>%
  relocate(starts_with("lg"))


# A tibble: 7 x 10
  lg0   lg1   lg2   lg3   lg4   ld0   ld1   ld2   ld3   ld4  
  <lgl> <lgl> <lgl> <lgl> <lgl> <lgl> <lgl> <lgl> <lgl> <lgl>
1 FALSE FALSE FALSE FALSE TRUE  TRUE  FALSE FALSE FALSE FALSE
2 FALSE FALSE TRUE  FALSE FALSE TRUE  FALSE FALSE FALSE FALSE
3 TRUE  FALSE FALSE FALSE FALSE TRUE  FALSE FALSE FALSE FALSE
4 TRUE  FALSE FALSE FALSE FALSE FALSE TRUE  FALSE FALSE FALSE
5 TRUE  FALSE FALSE FALSE FALSE FALSE FALSE TRUE  FALSE FALSE
6 TRUE  FALSE FALSE FALSE FALSE TRUE  FALSE FALSE FALSE FALSE
7 TRUE  FALSE FALSE FALSE FALSE FALSE TRUE  FALSE FALSE FALSE

轉載請註明出處，本文鏈接：https://www.uj5u.com/net/394677.html

標籤：r dplyr 整理

上一篇：使用兩個登錄不同版本應用程式的用戶創建一個閃亮的應用程式

下一篇：如果使用R滿足條件，則將前導列值設為NA