用多列中的多個值替換多個字符？電阻-有解無憂

另一個執行緒很好地解決了類似的問題

但是我想做的是擺脫類似問題中的一些冗余。

使用他們的例子：

df <- data.frame(name = rep(letters[1:3], each = 3), foo=rep(1:9),var1 = letters[1:3], var2 = rep(3:5, each = 3))

創建：

df
  name foo var1 var2
1    a   1    a    3
2    a   2    a    3
3    a   3    a    3
4    b   4    b    4
5    b   5    b    4
6    b   6    b    4
7    c   7    c    5
8    c   8    c    5
9    c   9    c    5

但是我需要做什么才能用唯一值替換多個字符？

a=1
b=2
c=3

我試過：

df[,c(4,6)] <- lapply(df[,c(4,6)], function(x) replace(x,x %in% "a", 1), 
                                                             replace(x,x %in% "b", 2),
                                                             replace(x,x %in% "c", 3))

和

z<- c("a","b","c")
y<- c(1,2,3)
df[,c(1,3)] <- lapply(df[,c(1,3)], function(x) replace(x,x %in% z, y))

但兩者似乎都不起作用。

謝謝。

uj5u.com熱心網友回復：

您可以使用 dplyr::recode

df <- data.frame(name = rep(letters[1:3], each = 3), foo=rep(1:9),var1 = letters[1:3], var2 = rep(3:5, each = 3))


library(dplyr, warn.conflicts = FALSE)

df %>% 
  mutate(across(c(name, var1), ~ recode(., a = 1, b = 2, c = 3)))
#>   name foo var1 var2
#> 1    1   1    1    3
#> 2    1   2    2    3
#> 3    1   3    3    3
#> 4    2   4    1    4
#> 5    2   5    2    4
#> 6    2   6    3    4
#> 7    3   7    1    5
#> 8    3   8    2    5
#> 9    3   9    3    5

^{由reprex 包(v2.0.1)于 2021 年 10 月 19 日創建}

跨將應用所規定的功能~ recode(., a = 1, b = 2, c = 3)既name和var1。

使用~and.是另一種在across. 此函式等效于由定義的函式function(x) recode(x, a = 1, b = 2, c = 3)，您可以使用該代碼across代替~表單，它會給出相同的結果。我所知道的唯一名稱是它在中的名稱?across，即“purrr 風格的 lambda 函式”，因為 purrr 包是第一個使用公式以這種方式定義函式的包。

如果你想看到由公式產生的實際功能，你可以看看rlang::as_function(~ recode(., a = 1, b = 2, c = 3))，雖然這是一個有點超過一個以上，以支持使用更復雜..1，..2而..3在此不再使用。

現在 R 支持下面更簡單的定義函式的方式，這個 purrr 風格的函式可能不再有用，這樣寫只是一個舊習慣。

df <- data.frame(name = rep(letters[1:3], each = 3), foo=rep(1:9),var1 = letters[1:3], var2 = rep(3:5, each = 3))

library(dplyr, warn.conflicts = FALSE)

df %>% 
  mutate(across(c(name, var1), \(x) recode(x, a = 1, b = 2, c = 3)))
#>   name foo var1 var2
#> 1    1   1    1    3
#> 2    1   2    2    3
#> 3    1   3    3    3
#> 4    2   4    1    4
#> 5    2   5    2    4
#> 6    2   6    3    4
#> 7    3   7    1    5
#> 8    3   8    2    5
#> 9    3   9    3    5

^{由reprex 包(v2.0.1)于 2021 年 10 月 19 日創建}

uj5u.com熱心網友回復：

一個簡單的 for 回圈就可以解決問題：

for (i in 1:length(z)) {
  df[df==z[i]] <- y[i]
}

df

  name foo var1 var2
1    1   1    1    3
2    1   2    2    3
3    1   3    3    3
4    2   4    1    4
5    2   5    2    4
6    2   6    3    4
7    3   7    1    5
8    3   8    2    5
9    3   9    3    5

uj5u.com熱心網友回復：

您可以lookup結合使用向量apply：

z <- c("a","b","c")
y <- c(1,2,3)

lookup <- setNames(y, z)

df[,c(1,3)] <- apply(df[,c(1,3)], 2, function(x) lookup[x])
df

這回傳

  name foo var1 var2
1    1   1    1    3
2    1   2    2    3
3    1   3    3    3
4    2   4    1    4
5    2   5    2    4
6    2   6    3    4
7    3   7    1    5
8    3   8    2    5
9    3   9    3    5

uj5u.com熱心網友回復：

如果您對 tidyverse 方法持開放態度：

library(tidyverse)

df %>%
  mutate(across(c(var1, name), ~case_when(. == 'a' ~ 1,
                                          . == 'b' ~ 2,
                                          . == 'c' ~ 3)))

這使：

  name foo var1 var2
1    1   1    1    3
2    1   2    2    3
3    1   3    3    3
4    2   4    1    4
5    2   5    2    4
6    2   6    3    4
7    3   7    1    5
8    3   8    2    5
9    3   9    3    5

請注意，此代碼僅在您更改列的所有值時才有效。例如，如果您的 var1 列中有一個“d”，您沒有將其轉換為數字，則它將更改為 NA。

uj5u.com熱心網友回復：

# Import data: df => data.frame
df <- data.frame(name = rep(letters[1:3], each = 3), foo=rep(1:9),var1 = letters[1:3], var2 = rep(3:5, each = 3))

# Function performing a mapping replacement:
# replaceMultipleValues => function() 
replaceMultipleValues <- function(df, mapFrom, mapTo){
  # Extract the values in the data.frame: 
  # dfVals => named character vector
  dfVals <- unlist(df)
  
  # Get all values in the mapping & data 
  # and assign a name to them: tmp1 => named character vector 
  tmp1 <- c(
    setNames(mapTo, mapFrom), 
    setNames(dfVals, dfVals)
  )

  # Extract the unique values: 
  # valueMap => named character vector
  valueMap <- tmp1[!(duplicated(names(tmp1)))]
  
  # Recode the values, coerce vectors to appropriate
  # types: res => data.frame
  res <- type.convert(
    data.frame(
      matrix(
        valueMap[dfVals], 
        nrow = nrow(df),
        ncol = ncol(df),
        dimnames = dimnames(df)
      )
    )
  )
  
  # Explicitly define the returned object: data.frame => env
  return(res)
}

# Recode values in data.frame: 
# res => data.frame
res <- replaceMultipleValues(
  df, 
  c("a", "b", "c"), 
  c("1", "2", "3")
)

# Print data.frame to console: 
# data.frame => stdout(console)
res

轉載請註明出處，本文鏈接：https://www.uj5u.com/houduan/325657.html

標籤：r 代替重叠

上一篇：使用purrr標記許多模型的回歸樣本

下一篇：用R中的=連接兩個向量