R編程中for回圈回傳的重復資料幀行-有解無憂

我目前正在根據計算添加新列。這是樣本資料

REC = c(237, 1781, NA, 3710, 2099)
S = c(2509, 25616, NaN, 19224, 6569)
Industry = c("ABC", "ABC", "ABC",  "CDE", "CDE")
data = data.frame(REC, S, Industry)

我想將單位長度縮放應用于新添加的列。為此，我撰寫了這段代碼

  data2 = data.frame()
  
  foreach(i = unique(data$Industry)) %do% {
    foreach(j = fnames) %do% {
      dataOrg = data
      
      # Calculate unit length per feature
      dataFin = dataOrg[dataOrg[,"Industry"] == i & is.finite(dataOrg[,j]), ] #Filtering only finite data
      data1 = dplyr::filter(dataOrg[!is.finite(dataOrg[,j]), ]) # Filtering the non finite data
      
      dataFin[ , sprintf("%s_uLen", j)] = dataFin[, j] / sqrt(sum(dataFin[, j]^2)) # Calculation
      data2 = data2 %>% 
        dplyr::bind_rows(data1, dataFin)
    }
  }

這是每次迭代后的輸出

[[1]]
[[1]][[1]]
   REC     S Industry  REC_uLen
1   NA   NaN      ABC        NA
2  237  2509      ABC 0.1319085
3 1781 25616      ABC 0.9912619

[[1]][[2]]
   REC     S Industry  REC_uLen     S_uLen
1   NA   NaN      ABC        NA         NA
2  237  2509      ABC 0.1319085         NA
3 1781 25616      ABC 0.9912619         NA
4   NA   NaN      ABC        NA         NA
5  237  2509      ABC        NA 0.09748012
6 1781 25616      ABC        NA 0.99523747


[[2]]
[[2]][[1]]
   REC     S Industry  REC_uLen     S_uLen
1   NA   NaN      ABC        NA         NA
2  237  2509      ABC 0.1319085         NA
3 1781 25616      ABC 0.9912619         NA
4   NA   NaN      ABC        NA         NA
5  237  2509      ABC        NA 0.09748012
6 1781 25616      ABC        NA 0.99523747
7   NA   NaN      ABC        NA         NA
8 3710 19224      CDE 0.8703574         NA
9 2099  6569      CDE 0.4924205         NA

[[2]][[2]]
    REC     S Industry  REC_uLen     S_uLen
1    NA   NaN      ABC        NA         NA
2   237  2509      ABC 0.1319085         NA
3  1781 25616      ABC 0.9912619         NA
4    NA   NaN      ABC        NA         NA
5   237  2509      ABC        NA 0.09748012
6  1781 25616      ABC        NA 0.99523747
7    NA   NaN      ABC        NA         NA
8  3710 19224      CDE 0.8703574         NA
9  2099  6569      CDE 0.4924205         NA
10   NA   NaN      ABC        NA         NA
11 3710 19224      CDE        NA 0.94627897
12 2099  6569      CDE        NA 0.32335136

在每一步都添加了 3 條新聞。我希望我的輸出包含相同的 5 行資料，但包含新添加的列。

這是預期的輸出

   REC     S Industry  REC_uLen     S_uLen
1  237  2509      ABC 0.1319085 0.09748012
2 1781 25616      ABC 0.9912619 0.99523747
3   NA   NaN      ABC        NA         NA
4 3710 19224      CDE 0.8703574 0.94627897
5 2099  6569      CDE 0.4924205 0.32335136

uj5u.com熱心網友回復：

以下是我在連接等方面的考慮：

library(foreach)
library(dplyr)
#> 
#> Attaching package: 'dplyr'
#> The following objects are masked from 'package:stats':
#> 
#>     filter, lag
#> The following objects are masked from 'package:base':
#> 
#>     intersect, setdiff, setequal, union
REC = c(237, 1781, NA, 3710, 2099)
S = c(2509, 25616, NaN, 19224, 6569)
Industry = c("ABC", "ABC", "ABC",  "CDE", "CDE")
data = data.frame(REC, S, Industry)

fnames <- c("REC", "S")
out <- NULL
foreach(i = unique(data$Industry)) %do% {
  dataFin = subset(data, Industry == i) #Filtering only finite data
  foreach(j = fnames) %do% {
    dataFin[[sprintf("%s_uLen", j)]] = dataFin[[j]] / sqrt(sum(dataFin[[j]]^2, na.rm=TRUE)) # Calculation
  }
  out <- bind_rows(out, dataFin)
}
#> [[1]]
#>    REC     S Industry  REC_uLen     S_uLen
#> 1  237  2509      ABC 0.1319085 0.09748012
#> 2 1781 25616      ABC 0.9912619 0.99523747
#> 3   NA   NaN      ABC        NA        NaN
#> 
#> [[2]]
#>    REC     S Industry  REC_uLen     S_uLen
#> 1  237  2509      ABC 0.1319085 0.09748012
#> 2 1781 25616      ABC 0.9912619 0.99523747
#> 3   NA   NaN      ABC        NA        NaN
#> 4 3710 19224      CDE 0.8703574 0.94627897
#> 5 2099  6569      CDE 0.4924205 0.32335136
out
#>    REC     S Industry  REC_uLen     S_uLen
#> 1  237  2509      ABC 0.1319085 0.09748012
#> 2 1781 25616      ABC 0.9912619 0.99523747
#> 3   NA   NaN      ABC        NA        NaN
#> 4 3710 19224      CDE 0.8703574 0.94627897
#> 5 2099  6569      CDE 0.4924205 0.32335136

^{由reprex 包于 2022-02-16 創建(v2.0.1)}

轉載請註明出處，本文鏈接：https://www.uj5u.com/shujuku/424725.html

標籤：r for循环前锋

上一篇：javascript陣列索引按值升序

下一篇：使用\分隔符搜索最后一列并將與其關聯的電子郵件地址保存到變數中