說我有一個資料框
Name <- c("Jon", "Jon", "Maria", "Maria", "Tina", "Tina")
Score <- c(23, 23, 32, 32, 26, 78)
df <- data.frame(Name, Score)
我想看看每個名稱的分數列是相同還是不同。理論上,我希望每個名稱的每列得分相同,但可能是它們不同(例如 Tina),我想檢查一下。
什么可能是一種有效的方法來做到這一點?(我的資料框有超過 150 000 行)。
uj5u.com熱心網友回復:
試試這個來獲得計數,然后你可以檢查名稱是否重復
library(magrittr)
library(dplyr)
df %>%
count(Name, Score)%>%
add_count(Name, name = "name_n")%>%
filter(name_n > 1)
#output
Name Score n name_n
1 Tina 26 1 2
2 Tina 78 1 2
uj5u.com熱心網友回復:
這會有幫助嗎?
> df %>% count(Name, Score) %>% filter(n<2)
Name Score n
1 Tina 26 1
2 Tina 78 1
轉載請註明出處,本文鏈接:https://www.uj5u.com/qianduan/491342.html
上一篇:將文本字串附加到R中的列單元格