有没有一种方法可以根据类似的文字进行过滤?

时间:2019-05-03 18:26:42

标签: r dplyr tidyverse

在SQL中,您可以使用LIKE "xxx%"根据文本进行过滤。我基本上是想在R中做同样的事情。

由于提取数据的方式,两个文本行包含符号,因此R无法识别确切的文本行。

本质上,我试图使以下代码正常工作,但是由于符号的原因,“享受” 并不是完整的文本。

Premium <- emaild %>% 
  filter(Cell_Subject_Line == "Enjoy the")

1 个答案:

答案 0 :(得分:2)

您可以使用几种方法。 data.table程序包具有like函数,该函数可以像SQL一样过滤:

library(data.table)
library(dplyr)
Premium <- emaild %>% 
  filter(Cell_subject_line %like% "Enjoy the")

否则,您可以使用stringr之类的str_detect()函数:

library(tidyverse)
Premium <- emaild %>% 
  filter(str_detect(Cell_subject_line, pattern = "Enjoy the"))