如何匹配R中的类似文档

时间:2017-03-25 23:16:11

标签: r twitter text-mining

我创建了两个语料库:一个包含推文文本,另一个包含公司名称。我试图做的是找到推文中提到的公司。

推文的示例文件:

Object

公司的示例文件:

sender

我想要一个与tweet_corp [[175]]和company_corp [[1397]]匹配的输出。有没有办法做到这一点?

1 个答案:

答案 0 :(得分:0)

您可以使用stringr包来检查公司名称是否出现在推文中,例如

library(stringr)

company_name <- "general motor"

tweet <- "general motor send mexican made model chevi cruze us car dealer tax free across border make usaor pay big border tax"

# check whether a company name occurs in a string
str_detect(
  string = tweet,
  pattern = coll(company_name)
)