从折叠的字符(包括“ |”)中提取正则表达式

时间:2019-10-31 10:30:31

标签: r regex

我想使用str_detectstr_extract从文本中检测(然后提取)月份名称。

为此,我创建了一个包含所有月份名称和缩写的对象。

m <- paste(c(month.name, month.abb), collapse = "|")
> m
[1] "January|February|March|April|May|June|July|August|September|October|November|December|Jan|Feb|Mar|Apr|May|Jun|Jul|Aug|Sep|Oct|Nov|Dec"

然后,我想检测单个词(由词边界包围)中出现的所有条目:

stringr::str_detect(c("inJan", "Jan"), str_glue("\\b{m}\\b"))

但是,这将返回TRUE TRUE(我希望FALSE TRUE,因为第一个单词不是一个单词。

我怀疑这是由于列表崩溃,因为stringr::str_detect(c("inJan", "Jan"), str_glue("\\bJan\\b"))返回了预期的FALSE TRUE

但是,我需要检测m的出现。最好的方法是什么?

0 个答案:

没有答案