所以我有一个像这样的文本块:
“最糟糕最不专业......我不推荐......我赞美她的辛勤工作......”
如何匹配确切的单词“commend”,计算他们的频率?
问题:
我正在计算这个词的推荐次数。
wrds <- gregexpr(pattern = "^commend$", string, fixed = TRUE)[[1]]
length(wrds)
但它返回-1
如果我尝试:
gregexpr(pattern = "commend", string, fixed = TRUE)[[1]]
输出为2,同时推荐和推荐
gregexpr我缺少什么?
答案 0 :(得分:3)
fixed = TRUE
。我们想要一个正则表达式,而不是一个字符串。使用单词边界字符\b
。要在R中的字符串中使用它,您需要转义反斜杠:"\\b"
wrds <- gregexpr(pattern = "\\bcommend\\b", string)[[1]]
绝对不要使用额外的空间。这将无法匹配&#34;推荐,&#34;还有很多其他的可能性。这就是边界这个词的含义。