使用word2vec对新闻文章的情感分析

时间:2018-03-18 16:37:29

标签: python sentiment-analysis word2vec

我目前正在开展一个项目,我正在尝试使用word2vec创建德国新闻媒体(来自9个不同网站的60,000篇文章)的新闻文章的情绪分析。

我目前的做法是:

  • 将文章的文本转储到文件中(每个新闻媒体一个)
  • 将得到的文本语料库提供给模型(每个新闻媒体一个)→单词向量
  • 使用权重介于-1和1之间的正/负德语单词数据集,表示通过使用gensim.word2vec提供的相似度函数为文章中的单词创建“情绪分数”的情绪
  • 为未包含在培训数据中的大量新闻文章创建平均分数

现在问题是我不确定应该选择哪些词进行分析。我可以使用文章中的每个单词,也可以只过滤相关单词,然后创建分数。

你认为这是一种有效/好的方法吗?您是否知道更好的方法是什么?

0 个答案:

没有答案