使用tweepy获取具有特定状态ID的推文

时间:2016-04-06 00:53:03

标签: python twitter status tweepy

我列出了我需要获取的推文的具体状态ID。 tweepy文档提供以下内容:

 API.get_status(id)

Returns a single status specified by the ID parameter.
Parameters: id – The numerical ID of the status.
Return type:    Status object

我无法弄清楚如何使用它或查找任何示例。 这甚至是正确的吗?

我的ID列表长度为2240项,看起来像这样:

response_ids = [717289507981107201, 717289501337509888, ..., 716684885411237888]

这些ID来自' in_response_to_status_id'我已经拥有的推文领域(我希望将我发布的推文与他们为响应而编写的推文相匹配)。

我基本上想写类似

的东西
for id in response_ids:
    tweet = API.get_status(id)

有关如何执行此操作的任何帮助,或有关是否可行的建议,非常感谢。

2 个答案:

答案 0 :(得分:3)

最好使用' statuses_lookup'命令。以下链接http://docs.tweepy.org/en/v3.5.0/api.html#API.statuses_lookup

中的更多信息

在运行以下程序之前,获取使用者密钥和令牌。

import tweepy
consumer_key = xxxx
consumer_secret = xxxx
access_token = xxxx
access_token_secret = xxxx

auth = tweepy.OAuthHandler(consumer_key, consumer_secret)
auth.set_access_token(access_token, access_token_secret)

api = tweepy.API(auth)

tweets = api.statuses_lookup(id_list) # id_list is the list of tweet ids
tweet_txt = []
for i in tweets:
    tweet_txt.append(i.text)

答案 1 :(得分:0)

想想我已经解决了。

get_status似乎是正确的用法,尽管我最初在分页错误方面遇到了一些问题。我已经破解了一些代码,以回应另一个similar problem来提出这个解决方案:

def paginate(iterable, page_size):
    while True:
        i1, i2 = itertools.tee(iterable)
        iterable, page = (itertools.islice(i1, page_size, None),
                list(itertools.islice(i2, page_size)))
        if len(page) == 0:
            break
        yield page

index = 0
for page in paginate(response_ids, 1):
    result = api.get_status(response_ids[index])._json
    index += 1