标签: java text-mining search-keywords
我使用Boilerpipe分析了一些java程序的新闻评论。我使用Pattern和Matcher从文本中提取关键字。
Pattern
Matcher
我的问题是我有一些企业(WHO,Total,2A,SEE,ARE ......)我还需要提取,正如你所看到的,他们的名字也存在于常用词中,所以我得到一些“谁,看,是“......结果,尽管文章没有谈到企业。您是否知道如何解决问题(也许就像分析单词的邻域一样......)?