我有一個包含數百萬個句子的文本列的資料集。我想過濾掉所有包含這兩個詞的句子
immigr*
migra*
asyl*
refug*
是否有一個我不知道的簡潔的小功能?到目前為止,我已經嘗試過
grep('immigr ', df$text)
但當時只能說一個字……
uj5u.com熱心網友回復:
您可以使用或 ( ) 折疊值|:
wd <- c("immigr*","migra*", "asyl*", "refug*")
grep(paste(wd, collapse = "|"), c("immigra", "other"))
1
轉載請註明出處,本文鏈接:https://www.uj5u.com/qukuanlian/488576.html
上一篇:將表的輸出匯總到簡單的列
