我需要一个建议。
我正在尝试了解Twitter API速率限制。
我有一个大约有10000个Twitter句柄的csv文件。
我需要下载这些用户的推文和转推。
如果我循环处理并下载数据 - 这将如何影响Twitter的速率限制?我的脚本可以在没有被列入黑名单的情况下进行多少次通话?
使用Stream API可以实现吗?
我将使用Python和Tweepy。
提前致谢。
答案 0 :(得分:1)
这是可能的,但您需要将其错开以尊重速率限制。我使用这样的东西(来自之前的答案:1,2):
alltweets = []
new_tweets = api.user_timeline(screen_name = screen_name,count=200)
# save most recent tweets
alltweets.extend(new_tweets)
# save the id of the oldest tweet less one
oldest = alltweets[-1].id - 1
#keep grabbing tweets until there are no tweets left to grab
while new_tweets:
try:
new_tweets = api.user_timeline(screen_name = screen_name,count=200,max_id=oldest)
except tweepy.TweepError:
time.sleep(60 * 15)
continue
```