我正在尝试使用tweepy获取twitters timelime,但是我不能得到超过一年前的旧推文。
我的Python脚本如下所示:
#!/usr/bin/env python
# -*- coding:utf-8 -*-
from __future__ import unicode_literals
import tweepy
import json
CONSUMER_KEY = 'XXXXXXXXXXXXXXXXXXXXX'
CONSUMER_SECRET = 'XXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXX'
auth = tweepy.OAuthHandler(CONSUMER_KEY, CONSUMER_SECRET)
ACCESS_TOKEN = 'XXXXXXX-XXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXX'
ACCESS_SECRET = 'XXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXX'
auth.set_access_token(ACCESS_TOKEN, ACCESS_SECRET)
api = tweepy.API(auth)
user = api.get_user(screen_name='twitter_acount')
for tw in tweepy.Cursor(api.user_timeline, user_id=user.id, count=15000).items():
json_str = json.dumps(tw._json)
print json_str
print '\n'
我执行了这个脚本,用于获取推文超过15000的用户的推文,但我只得到了大约3113条推文,我收到的最早推文的日期是2015年11月22日,即一年前。
答案 0 :(得分:1)
Twitter Search API仅限于7天的历史记录,时间线API仅限于可以检索的推文数量。实际上你应该only be able to fetch 3200 Tweets所以我不确定你是怎么看到9800的。
如果您需要历史数据,则Twitter's Gnip products会提供全面的报道。这些是商业API。