如何在r的范圍內回傳.csv列中的值數-有解無憂

我有一個檔案，其中第二列包含感興趣的值。我正在嘗試遍歷一組數字 (n) 并使用 R 計算該列中 n-5:n 5 范圍內的值出現的次數。然后我希望將其輸出到.csv（但到目前為止還沒有將其寫入代碼）。

我一直在使用：

library(expss)
SNP_file <- read.csv("testdata.csv", header = FALSE, sep = "\t")
for (n in 31130:31150) {
  SNP_Number <- 0
  SNP_Number <- count_if(n-5:n 5, SNP_file$V2)
  df <- data.frame(column1 = c(n), column2 = c(SNP_Number))
  print(df)
  
}

在 testdata.csv 中，第二列中有 31140 和 31141 的值。

這將回傳如下輸出：


  column1 column2
1   31130       1
  column1 column2
1   31131       1
  column1 column2
1   31132       1
  column1 column2
1   31133       1
  column1 column2
1   31134       1
  column1 column2
1   31135       1
  column1 column2
1   31136       1
  column1 column2
1   31137       1
  column1 column2
1   31138       1
  column1 column2
1   31139       1
  column1 column2
1   31140       2
  column1 column2
1   31141       3
  column1 column2
1   31142       3
  column1 column2
1   31143       3
  column1 column2
1   31144       3
  column1 column2
1   31145       3
  column1 column2
1   31146       3
  column1 column2
1   31147       3
  column1 column2
1   31148       3
  column1 column2
1   31149       3
  column1 column2
1   31150       3

但這開始是因為錯誤地記錄了初始值 1，其中應該是值 0，每次 n 超過 testdata.csv 中的另一個值時，它只會增加，并且一旦 n 在范圍 n-5:n 5。

所以它應該看起來像：


  column1 column2
1   31130       0
  column1 column2
1   31131       0
  column1 column2
1   31132       0
  column1 column2
1   31133       0
  column1 column2
1   31134       0
  column1 column2
1   31135       1
  column1 column2
1   31136       2
  column1 column2
1   31137       2
  column1 column2
1   31138       2
  column1 column2
1   31139       2
  column1 column2
1   31140       2
  column1 column2
1   31141       2
  column1 column2
1   31142       2
  column1 column2
1   31143       2
  column1 column2
1   31144       2
  column1 column2
1   31145       2
  column1 column2
1   31146       1
  column1 column2
1   31147       0
  column1 column2
1   31148       0
  column1 column2
1   31149       0
  column1 column2
1   31150       0

我在這里做錯了什么？

uj5u.com熱心網友回復：

嘗試這個：

vec <- c(22761L, 31140L, 31141L, 36701L, 44108L, 46917L, 51958L, 53661L,  119844L, 119845L, 184836L, 195026L, 249733L, 251024L, 271357L,  287257L, 360638L, 382559L, 384590L, 399027L)

sapply(31130:31150, function(z) sum( (z-5) <= vec & vec <= (z 5) ))
#  [1] 0 0 0 0 0 1 2 2 2 2 2 2 2 2 2 2 1 0 0 0 0

轉載請註明出處，本文鏈接：https://www.uj5u.com/qita/365289.html

標籤：r 数据框文件快递

上一篇：轉換python資料框上的資料型別

下一篇：透視csv并保留沒有熊貓的關鍵列