我需要获取一组给定关键字的Twitter历史数据。 Twitter Search API会返回不超过9天的推文,因此不会这样做。我目前正在使用Tweepy Library(http://code.google.com/p/tweepy/)来调用Streaming API,它工作正常,但速度太慢。例如,当我搜索“$ GOOG”时,有时两个结果之间需要一个多小时。肯定有包含该关键字的推文,但它没有足够快地返回结果。
可能是什么问题? Streaming API是慢还是我的访问方法有问题?有没有更好的方法来免费获得这些数据?
答案 0 :(得分:1)
你需要多长时间?要获取历史数据,您可能希望无限期地保持流(流API允许这样做)并在本地存储流,然后从数据库中检索历史数据。
我也使用Tweepy进行直播/过滤,效果很好。延迟通常<1。 1s和Tweepy能够处理大量的流。
答案 1 :(得分:0)
流式API太快你发布消息就得到消息,我们使用twitter4j。但流媒体只播放当前消息,所以如果你在发送推文的那一刻没有收听流媒体,那么消息就会丢失。