Twitter数据分析:可视化

时间:2015-03-08 19:03:14

标签: twitter data-visualization data-analysis sentiment-analysis topsy

我是一个新手学习可视化。我想对推特数据进行可视化:基于国家(地图)和时间变化的最佳趋势(一年或多年)。有人能告诉我在哪里可以得到Twitter数据集,任何关于如何开始进行的建议都会非常有用。

我找到了一个名为topsy.com的网站,该网站过去几年都有Twitter数据,但我不确定他们是否允许网页抓取来获取数据。

还有其他数据集吗?

由于

2 个答案:

答案 0 :(得分:1)

根据定义,Twitter信息是公开的。但是,这并不意味着我们可以轻松地进行试验。

事实上,有很多像topsy.com这样提供Twitter历史信息的网站,但是他们不会免费赠送(这实际上就是他们的业务)。

您可以随时通过streaming APIREST API与Twitter建立联系。两者都是公开的和免费的;流式传输API意味着连接到所有新消息,如果没有速率限制(see this),REST API将直观地更适合您的目的。

如果您只是愿意尝试可视化,我宁愿选择不同的数据集。有很多,你可以在Data Science Centralhere,或许多其他人中找到你喜欢的。

希望它有所帮助。

答案 1 :(得分:1)

上面的答案已经有了一个Twitter数据集,但还有其他可用的,比如这个Snap。 当你提出一些建议时,我不确切地知道你对答案的期望是什么。在我正在工作的项目中,我们正在收集自己的数据。如果有必要,您可以使用可用数据集启动项目,同时收集自己的数据。如果您想要“实时”可视化,则需要自己收集,但如果它只是用于学习或仅用于可视化本身,您可以使用这些可用的数据集。

最后,我不知道你是否要求这样做,但对于可视化实现,D3.js library是非常有用的,并允许很多自定义。 我希望有所帮助。祝你的可视化好运。