我计划从tripadvisor获取一些评论数据,我希望能够提取酒店相关方面并为他们指定极性并将其归类为消极或积极。
我可以使用哪些工具来实现此目的以及如何以及从何处开始?我知道有一些工具,如GATE,Stanford NLP,Open NLP等,但我能否执行上述特定任务?如果是这样,请让我知道前进的方法。我打算使用Java作为编程语言的选择,并希望使用一些API
另外,我应该继续使用基于规则的方法还是使用经过训练的评论语料库的ML方法,那么完全采用其他方法吗?
P.S:我是NLP的新手,我需要一些帮助才能继续前进。答案 0 :(得分:0)
斯坦福大学CoreNLP
在一个软件包中有很多功能
但是在Apache OpenNLP包中
但是它们没有内置功能来查找情感极性所以你必须将你的标签传递给其他库,例如SentiwordNet以找出极性。
我使用了OpenNLP
和斯坦福Core NLP
。但是对于这两者,你需要修改关于餐馆域的情绪语料库。
答案 1 :(得分:0)
您可以尝试ConceptNet
(http://conceptnet5.media.mit.edu/)。例如,请参阅此处(页面底部):https://github.com/commonsense/conceptnet5/wiki/API如何“查看具有最积极影响的20个英文内容:”