我有一個包含 91 個變數的資料框。我試圖僅提取行中每個值都與另一個值重復的行。我可以使用 unique 函式或 distinct 函式來查看有 233 行是重復的。我想用這 233 條記錄創建一個資料框。我看到的關于類似問題的大多數答案都集中在通過某種 ID 變數查找重復值,但是我的資料沒有任何此類變數。我想將整行視為一個整體,而不僅僅是其中一個變數。如何創建僅包含重復行的資料框?
uj5u.com熱心網友回復:
您可以子集duplicated:
data[duplicated(data),]
ID var1 var2
2 1 1 1
或在dplyr:
data %>%
filter(duplicated(.))
玩具資料:
data <- data.frame(ID = c(1, 1, 1, 2, 2, 3, 3, 3, 4, 4, 4),
var1 = c(1, 1, 2, 5, 10, NA, 5, 23, NA, NA, 1),
var2 = c(1, 1, NA, NA, 1, NA, 0, 1, 3, 23, 4))
轉載請註明出處,本文鏈接:https://www.uj5u.com/qiye/336899.html
標籤:r
