我列出了我需要获取的推文的具体状态ID。 tweepy文档提供以下内容:
API.get_status(id)
Returns a single status specified by the ID parameter.
Parameters: id – The numerical ID of the status.
Return type: Status object
我无法弄清楚如何使用它或查找任何示例。 这甚至是正确的吗?
我的ID列表长度为2240项,看起来像这样:
response_ids = [717289507981107201, 717289501337509888, ..., 716684885411237888]
这些ID来自' in_response_to_status_id'我已经拥有的推文领域(我希望将我发布的推文与他们为响应而编写的推文相匹配)。
我基本上想写类似
的东西for id in response_ids:
tweet = API.get_status(id)
有关如何执行此操作的任何帮助,或有关是否可行的建议,非常感谢。
答案 0 :(得分:3)
最好使用' statuses_lookup'命令。以下链接http://docs.tweepy.org/en/v3.5.0/api.html#API.statuses_lookup
中的更多信息在运行以下程序之前,获取使用者密钥和令牌。
import tweepy
consumer_key = xxxx
consumer_secret = xxxx
access_token = xxxx
access_token_secret = xxxx
auth = tweepy.OAuthHandler(consumer_key, consumer_secret)
auth.set_access_token(access_token, access_token_secret)
api = tweepy.API(auth)
tweets = api.statuses_lookup(id_list) # id_list is the list of tweet ids
tweet_txt = []
for i in tweets:
tweet_txt.append(i.text)
答案 1 :(得分:0)
想想我已经解决了。
get_status
似乎是正确的用法,尽管我最初在分页错误方面遇到了一些问题。我已经破解了一些代码,以回应另一个similar problem来提出这个解决方案:
def paginate(iterable, page_size):
while True:
i1, i2 = itertools.tee(iterable)
iterable, page = (itertools.islice(i1, page_size, None),
list(itertools.islice(i2, page_size)))
if len(page) == 0:
break
yield page
index = 0
for page in paginate(response_ids, 1):
result = api.get_status(response_ids[index])._json
index += 1