对于一个特定关键字,我可以通过Twitter Search API获得多少数据?

时间:2014-10-23 01:42:07

标签: python twitter tweepy

我想使用python Tweepy库从twitter收集数据。

我调查了Twitter API的速率限制,即每15分钟180个请求。

我想知道我可以为一个特定关键字获取多少数据?当我使用Tweepy.Cursor时它会以另一种方式放置,当它停止时?

我不是说数学计算(100计* 180请求* 4次/小时等)而是实际经验。我发现了如下观点:

"使用特定关键字,您通常只能轮询每个关键字的最后5,000条推文。您受到特定时间段内可以提出的请求数量的限制。 " http://www.brightplanet.com/2013/06/twitter-firehose-vs-twitter-api-whats-the-difference-and-why-should-you-care/

这是否正确(如果这是正确的,我只需要运行程序5分钟左右)?或者我需要继续收到尽可能多的推文(这可能会使程序保持运行很长时间)?

1 个答案:

答案 0 :(得分:0)

你肯定不会收到尽可能多的推文。 Twitter限制你可以走多远的方式(以及有多少推文可用)的方式是将最小since_id参数传递给对Twitter API的GET search/tweets调用。在Tweepy中,API.search函数与Twitter API接口。 Twitter的GET search/tweets文档有很多好的信息:

  

可以通过API访问的推文数量有限制。如果自since_id以来发生了推文限制,则since_id将被强制使用最旧的ID。

实际上,Tweepy的API.search不应该花很长时间才能获得所有可用的推文。请注意,根据Twitter API,并非所有推文都可用,但我的搜索时间从未超过10分钟。