使用twitter预测股市

时间:2017-01-11 22:58:47

标签: python twitter machine-learning yahoo-finance

我试图通过Twitter预测股市价值的日常积极性或消极性 我研究了很多关于这个主题的内容,我发现这个article开始了 基本上,我所做的是从雅虎财经获得相对于唐氏琼斯的日期,并计算这一天是正面还是负面。

在同一天,通过仅收集表达情绪的推文,获取包含I'm, feel, makes me等字词的所有推文。

我有一个单词列表(正面和负面),没有得分,只有单词 对于分析的每一天,我创建一个Python字典,其中包含列表中的单词作为键,以及作为值的分数,按以下方式计算:

score of a word = num of times the word matches tweets in a day /
                  num of total matches of all words

为了预测股票市场,我将朴素贝叶斯算法作为数据进行训练,将python词典与单词和相对分数进行训练,并根据财务数据将其作为目标“pos”或“neg”。

我收集了一年的日期(从2010年1月1日至2010年12月31日)。
单词列表的长度是18540 我正在使用Python 3.4,tweepy和scikit-learn

分类器效果不好,因为我是这个领域的新手,我想问一下我的程序是否有问题,或者你有什么建议可以帮助我。

感谢任何帮助

0 个答案:

没有答案