我正在嘗試對 data.table 進行子集化,這里是一個小例子,但需要做更大的一個。
我有 dt 和唯一的列,code_id 是關鍵:
> UniqueCodes
code_id
1:
2: .....
3: 10073011000001107
4: 10073911000001106
5: 10075611000001101
---
15114: x05ZX
15115: x05q2
15116: x05qb
15117: x05td
15118: x05xd
我有很長的代碼串列,我想保留(子集)并丟棄其余的。那么我如何對這個 df 進行子集化并只保留 x05ZX、X05qb 和 X05td 呢?我知道這些是我唯一想保留的?Thx,J。
uj5u.com熱心網友回復:
library(data.table)
code_id <- c(10073011000001107,
10073911000001106,
10075611000001101,
"x05ZX",
"x05q2",
"x05qb",
"x05td",
"x05xd",
"x05qb")
UniqueCodes <- data.table(code_id)
您可以使用要保留的代碼構建一個向量
codes <- c("x05ZX", "X05qb", "X05td", "x05qb")
然后將向量傳遞給 dt
UniqueCodes[code_id %in% codes]
## code_id
## 1: x05ZX
## 2: x05qb
## 3: x05qb
轉載請註明出處,本文鏈接:https://www.uj5u.com/yidong/368513.html
上一篇:使用“data.table”從重復行中選擇非“NA”值——當有多個分組變數時
下一篇:如何使用多核并行化R中的回圈?
