我是一个新手学习可视化。我想对推特数据进行可视化:基于国家(地图)和时间变化的最佳趋势(一年或多年)。有人能告诉我在哪里可以得到Twitter数据集,任何关于如何开始进行的建议都会非常有用。
我找到了一个名为topsy.com的网站,该网站过去几年都有Twitter数据,但我不确定他们是否允许网页抓取来获取数据。
还有其他数据集吗?
由于
答案 0 :(得分:1)
根据定义,Twitter信息是公开的。但是,这并不意味着我们可以轻松地进行试验。
事实上,有很多像topsy.com这样提供Twitter历史信息的网站,但是他们不会免费赠送(这实际上就是他们的业务)。
您可以随时通过streaming API或REST API与Twitter建立联系。两者都是公开的和免费的;流式传输API意味着连接到所有新消息,如果没有速率限制(see this),REST API将直观地更适合您的目的。
如果您只是愿意尝试可视化,我宁愿选择不同的数据集。有很多,你可以在Data Science Central,here,或许多其他人中找到你喜欢的。
希望它有所帮助。
答案 1 :(得分:1)
上面的答案已经有了一个Twitter数据集,但还有其他可用的,比如这个Snap。 当你提出一些建议时,我不确切地知道你对答案的期望是什么。在我正在工作的项目中,我们正在收集自己的数据。如果有必要,您可以使用可用数据集启动项目,同时收集自己的数据。如果您想要“实时”可视化,则需要自己收集,但如果它只是用于学习或仅用于可视化本身,您可以使用这些可用的数据集。
最后,我不知道你是否要求这样做,但对于可视化实现,D3.js library是非常有用的,并允许很多自定义。 我希望有所帮助。祝你的可视化好运。