如何将Stanford Core NLP与没有经过训练的电影数据集的算法进行比较?

时间:2016-01-05 09:11:21

标签: java nlp stanford-nlp sentiment-analysis

我希望使用经过电影评论培训的斯坦福核心NLP。我想将它与常规的情绪分析算法进行比较,该算法未经过电影评论的训练。有没有办法在没有经过训练的数据集的情况下使用Stanford Core NLP Link Here进行电影评论,还是可以使用其他任何来源直接进行比较?

3 个答案:

答案 0 :(得分:0)

在没有经过培训的电影评论数据集的情况下,CoreNLP Sentiment的含义不清楚。 Sentiment模型需要一些数据集来训练 - 未经训练的它根本不会做任何事情。可以在不是电影评论的数据集上训练它,但为此你必须找到或创建一个合适的数据集。

答案 1 :(得分:0)

  1. 您可以通过 VADER:A执行Polarity Sentiment Analysis 基于规则的社交媒体情感分析模型 文本即可。这个包使用正面和负面词(词典)的静态知识库。每次电影评论,提供4个分数:正面, 消极,中性情绪评分以及“复合”评分 (区别于其他三个)。
  2. 请参阅:

    https://github.com/cjhutto/vaderSentiment

    http://www.nltk.org/howto/sentiment.html

    http://www.nltk.org/_modules/nltk/sentiment/vader.html

    1. 可以从here获取其他词典。

    2. 据我所知,CoreNLP为英语提供经过培训的CoreNLP模型。请参阅here

答案 2 :(得分:0)

斯坦福CoreNLP API与使用电影评论培训的预训练模型捆绑在一起。所以你可以直接使用API​​。