替換data.frame中失去順序的值-有解無憂

在我的玩具中data，對于每個唯一的study，數字變數（sample和group）必須有一個從1. 但：

例如，在中study 1，我們看到有兩個唯一sample值 ( 1& 3)，因此3必須替換為2。

例如，在中study 2，我們看到有一個唯一group值 ( 2)，因此必須將其替換為1。

在study 3,sample和group似乎都可以，這意味著它們的唯一值是1和2（不需要替換）。

對于這個玩具data，我想要的輸出如下所示。但我很欣賞一個功能性解決方案，它可以自動替換data.frame 中任意數量的數字變數，這些變數就像我在玩具中展示的那樣data。

m="
study sample group outcome
1      1     1       A
1      1     1       B
1      1     2       A
1      1     2       B 
1      3     1       A
1      3     1       B
1      3     2       A
1      3     2       B

2      1     2       A
2      1     2       B
2      2     2       A
2      2     2       B
2      3     2       A
2      3     2       B

3      1     1       A
3      1     1       B
3      1     2       A
3      1     2       B
3      2     1       A
3      2     1       B
3      2     2       A
3      2     2       B"

data <- read.table(text=m, h=T)

Desired_output="
study sample group outcome
1      1     1       A
1      1     1       B
1      1     2       A
1      1     2       B 
1      2     1       A
1      2     1       B
1      2     2       A
1      2     2       B

2      1     1       A
2      1     1       B
2      2     1       A
2      2     1       B
2      3     1       A
2      3     1       B

3      1     1       A
3      1     1       B
3      1     2       A
3      1     2       B
3      2     1       A
3      2     1       B
3      2     2       A
3      2     2       B"

uj5u.com熱心網友回復：

你可以做：

library(dplyr)

data %>% 
  group_by(study) %>% 
  mutate(across(tidyselect::vars_select_helpers$where(is.numeric),
                function(x) as.numeric(as.factor(x)))) %>%
  as.data.frame()

生成的資料框如下所示：

   study sample group outcome
1      1      1     1       A
2      1      1     1       B
3      1      1     2       A
4      1      1     2       B
5      1      2     1       A
6      1      2     1       B
7      1      2     2       A
8      1      2     2       B
9      2      1     1       A
10     2      1     1       B
11     2      2     1       A
12     2      2     1       B
13     2      3     1       A
14     2      3     1       B
15     3      1     1       A
16     3      1     1       B
17     3      1     2       A
18     3      1     2       B
19     3      2     1       A
20     3      2     1       B
21     3      2     2       A
22     3      2     2       B

uj5u.com熱心網友回復：

這是一個替代方案（不像@Allan Cameron 1 那樣優雅）dplyr解決方案：

library(dplyr)
df %>% 
  group_by(study) %>% 
  mutate(x = n()/length(unique(sample)),
         sample =  rep(row_number(), each=x, length.out = n()),
         y = length(unique(group)),
         group = ifelse(y==1, 1, group)) %>% 
  select(-x, -y)

   study sample group outcome
   <int>  <int> <dbl> <chr>  
 1     1      1     1 A      
 2     1      1     1 B      
 3     1      1     2 A      
 4     1      1     2 B      
 5     1      2     1 A      
 6     1      2     1 B      
 7     1      2     2 A      
 8     1      2     2 B      
 9     2      1     1 A      
10     2      1     1 B      
11     2      2     1 A      
12     2      2     1 B      
13     2      3     1 A      
14     2      3     1 B      
15     3      1     1 A      
16     3      1     1 B      
17     3      1     2 A      
18     3      1     2 B      
19     3      2     1 A      
20     3      2     1 B      
21     3      2     2 A      
22     3      2     2 B

轉載請註明出處，本文鏈接：https://www.uj5u.com/caozuo/338410.html

標籤：r 数据框功能 dplyr 整理宇宙

上一篇：根據條件回傳不同的df

下一篇：C#傳遞帶有引數的Func，其中1個引數在傳遞時設定，其他引數在內部設定