情绪词典用于股市预测

时间:2018-03-19 10:35:49

标签: python machine-learning nlp nltk sentiment-analysis

我正在制作一个股市预测机器学习应用程序,它将尝试预测特定股票的价格。由于这个原因,它将收集关于该特定公司和公司历史数据的新闻文章/推文。

我的问题是我需要首先为该公司的标题/推文构建一个情绪分析器。我不想训练模型给我情感分数,我想要一个包含一袋与股票市场和金融相关的词汇的情感词典。

我可以在项目中使用任何此类词典/词典吗?

由于

3 个答案:

答案 0 :(得分:2)

不是很容易获得,但是要靠自己建立是微不足道的。只需下载情绪注释的twitter数据集,为其构建单词词典,迭代条目并将+1 /( - 1)添加到正(/负)单词。最后,将每个单词的值除以其各自的出现次数,每个单词都有一个天真的情感分数,值接近1(/ - 1)表示强烈的情绪冲击,可以用于你的BoW任务。

答案 1 :(得分:1)

Notre Dame大学的会计和财务软件存储库中的人们已经开发了一个基于财务的词典,这可能与您的目的非常相关。我不确定该词典的开发方式,但是我相信它可能是通过对财务文档(即10-K)进行机器学习或由工作人员进行定性注释而生成的。

该词典包含354个正向定义词,以及2355个负向定义词。不幸的是,单词并不带有基于频谱的情感评分,只能根据输入到词典中的年份来识别。您可以简单地为所有单词设置总得分,或者如果您个人具有时间评价单词的情感(如果需要,请确保发布您的作品!)。该词典还包含许多类别,除了肯定和否定之外,包括不确定性,诉讼和有趣。

我已经在个人句子新闻摘录中亲自测试过词典,并且效果很好(我使用vader作为基本词典,然后在顶部添加了财务词典)。

找到字典here

答案 2 :(得分:0)

有一些公开的情感词典(不是特定领域的,但这通常不是问题):

  1. 英文:http://saifmohammad.com/WebPages/NRC-Emotion-Lexicon.htm
  2. 法语:http://advanse.lirmm.fr/feel.php