什么是匹配“煤炭”这个词的正则表达式?

时间:2014-06-20 06:21:49

标签: regex r grep

我在R中使用grep命令查找数据框列中所有出现的单词CoalCoal可以出现在值的任何位置。例如,Coal Combustion也是有效值。这是什么正则表达式?

我尝试过使用:

grep("[:Coal:]", NEI[,5])

但它没有给我正确的答案。

感谢任何帮助。

2 个答案:

答案 0 :(得分:1)

您可以使用:

regmatches(subject, gregexpr(".*Coal.*", subject, perl=TRUE));

如果你想确保煤没有嵌入一个单词,只需添加边界:

grepl("\\bCoal\\b", subject, perl=TRUE);

答案 1 :(得分:0)

尝试

grep("\\bCoal\\b", NEI[,5])

\b部分与单词边界匹配,因此“Coal”不能触及任何其他字母。