用R搜索语料库中的单词

时间:2015-09-07 11:03:11

标签: r full-text-search word corpus

我正在尝试使用R在语料库中搜索单词串。在grep中允许使用析取语句,例如grep(" a"或" b"或&#34 ; C" ...)?如果是这样,一旦我有了这个子目录,我该如何进一步优化它以仅包含具有至少两个原始状态标记的示例?

1 个答案:

答案 0 :(得分:1)

是的,垂直条|grep中作为or-operator。您可以通过运行?regex在R中查找正则表达式。

所以,举个例子:

grep("ape|bass|cat", c("monkey", "bass", "catfish"))
[1] 2 3

还提供grepgrepl和该系列函数的文档。 stringr包提供了用于处理文本的其他工具。