Tweepy API搜索结果和速率限制

时间:2014-10-24 11:15:22

标签: python twitter tweepy

我是Python和Tweepy的新手,我已经玩了一段时间了。我通过guming找到了这个piece of code。我一直用它来填充带有推文的Excel文件,效果很好。

但我有几个问题:我可以使用此循环获得多少推文?或者更具体地说,当我在过去几天获得第一个2000时,那些是否为我搜索的标签发布了所有推文?或者它与Streaming API相同,我可以获得所有推文的1%?

而且我并不理解我的速度限制。使用上述代码获取10.000条推文需要多少查询?是每页100条推文,所以需要100页= 100次查询?

1 个答案:

答案 0 :(得分:6)

当我获得最后几天的第一个2000时,是否为我搜索过的标签发布了所有推文?或者它与Stream API相同,我可以获得所有推文的1%?

都不是。 Twitter在过去两周内发布推文。但是,对于所有关键字,这都不相同:

  

搜索API不是所有推文的完整索引,而是最近推文的索引。目前索引包含6-9天的推文。

此外,无法保证所有最近的推文都被Twitter搜索API编入索引:

  

重要的是要知道Search API专注于相关性而非完整性。这意味着搜索结果中可能缺少某些推文和用户。

此信息来自Twitter Search API's general information page,这是一本很好的阅读材料,可以回答很多问题。

我并不理解我的速度限制。使用上述代码获取10.000条推文需要多少次查询?

Twitter API有chart解释不同资源的速率限制。价格限制为15分钟。对于搜索,每15分钟窗口有180个请求。由于您可以获得100-count per request,理论上您可以每15分钟收集180 * 100 = 18k的推文。 然而,您只能收集Twitter提供的尽可能多的推文(请参阅6-9天的内容)。您可以收集的推文数量取决于您的关键字以及Twitter提供的内容。