关于使用twitter数据进行数据挖掘

时间:2011-10-15 00:17:40

标签: twitter text-mining

我计划撰写一篇关于使用情绪信息来提高某些货币金融交易模型的可预测性的论文。

情绪数据应该是Twitter线程,包括一些关键字,如“EUR.USD”。我会过滤掉一些情绪词来识别情绪。简单的想法。然后我们试着看看这种情绪程度与欧元兑美元的走势之间是否存在任何关系。

我最关心的是Twitter数据。众所周知,twitter设置了查看历史数据的限制。您只能浏览5天。由于我们的策略基于日常情绪,这还不够。

我注意到谷歌有一些奇妙的事情,如关于推特更新的时间表:http://www.readwriteweb.com/archives/googles_twitter_timeline_lets_you_explore_the_past.php

但首先,我在瑞士,似乎我的谷歌没有这样的功能,这太聪明,无法识别我的位置,可能会阻止这样的美国谷歌版本功能。其次,即使我可以在我的Firefox上看到一些花哨的交互式谷歌时间轴控件,我怎样才能从我的查询中挖出数据并保存它们?谷歌供应这样的api吗?

1 个答案:

答案 0 :(得分:2)

您提到的Google服务最近已关闭,因此您将无法使用它。 (http://www.searchenginejournal.com/google-realtime-shuts-down-as-twitter-deal-expires/31007/

如果您需要更长的数据时间来分析,我会看到以下选项:

  • 支付历史数据:)(https://dev.twitter.com/docs/twitter-data-providers
  • 如果您不想付费,则需要获取包含欧元/美元的推文(您可以使用此流媒体API)并以某种方式存储它们。运行此服务一段时间(如果可能),您将拥有超过5天的数据。