我有一個資料框(A),其中有一列包含一些資訊。我有一個更大的資料框(B),它包含一個具有類似資訊的列,我需要檢測哪個列包含與資料框A中的列相同的資料。因為資料框B很大,手動查看以識別該列將很耗時。有什么方法可以讓我使用DataframeA中'some_info'列的資訊來找到DataframeB中包含該資訊的相應列?
dataframeA <- data. frame(some_info = c("a", "b"。 "c", "d", "e") )
dataframeB <- data. frame(id = 1。 8。 column_to_be_identified = c("a"/span>, "f", "b"。 "c","g", "d"。 "h", "e")。 "column_almost_similar_but_not_quite" =c("a"/span>。 "f", "b"。 "c","g", "3"。 "h", "e") )
基本上是這樣。是否有可能創建一個函式或類似的東西,通過dataframeB查看并檢測出完全包含dataframeA中的列的資訊的列?
預先感謝!
uj5u.com熱心網友回復:
如果我理解正確,你只想接收列名:
dataframeA <- data. frame(some_info = c("a"/span>。 "b"。 "c", "d", "e") )
dataframeB <- data. frame(id = 1:8,
column_to_be_identified = c("a"/span>。 "f", "b"。 "c","g", "d"。 "h", "e"),
column_almost_similar_but_not_quite = c("a"/span>。 "f", "b"。 "c","g", "3"。 "h", "e") )
relevant_column_name <- names()
其中()
# 遍歷所有列
sapply(dataframeB, function(x) {>
# unique對于大的向量來說是更有效的
x <- unique(x)
#是列中目標向量的所有值。
all(dataframeA$some_info %in% x)
})))
相關欄目名稱
#> [1] "column_to_be_identified"
uj5u.com熱心網友回復:
用select從dplyr我們可以這樣做
library(dplyr)
dataframeB%>%
選擇(where(~ 是。 字符(.) &&。
all(dataframeA$some_info %in% 。 )) %>% 。
名稱
[1] " column_to_be_identified"
轉載請註明出處,本文鏈接:https://www.uj5u.com/qianduan/309177.html
標籤:
