Question

我列出了我需要获取的推文的具体状态ID。 tweepy文档提供以下内容：

 API.get_status(id)

Returns a single status specified by the ID parameter.
Parameters: id – The numerical ID of the status.
Return type:    Status object

我无法弄清楚如何使用它或查找任何示例。这甚至是正确的吗？

我的ID列表长度为2240项，看起来像这样：

response_ids = [717289507981107201, 717289501337509888, ..., 716684885411237888]

这些ID来自＆＃39; in_response_to_status_id＆＃39;我已经拥有的推文领域（我希望将我发布的推文与他们为响应而编写的推文相匹配）。

我基本上想写类似

的东西

for id in response_ids:
    tweet = API.get_status(id)

有关如何执行此操作的任何帮助，或有关是否可行的建议，非常感谢。

Answer 1

最好使用＆＃39; statuses_lookup＆＃39;命令。以下链接http://docs.tweepy.org/en/v3.5.0/api.html#API.statuses_lookup

中的更多信息

在运行以下程序之前，获取使用者密钥和令牌。

import tweepy
consumer_key = xxxx
consumer_secret = xxxx
access_token = xxxx
access_token_secret = xxxx

auth = tweepy.OAuthHandler(consumer_key, consumer_secret)
auth.set_access_token(access_token, access_token_secret)

api = tweepy.API(auth)

tweets = api.statuses_lookup(id_list) # id_list is the list of tweet ids
tweet_txt = []
for i in tweets:
    tweet_txt.append(i.text)

Answer 2

想想我已经解决了。

get_status似乎是正确的用法，尽管我最初在分页错误方面遇到了一些问题。我已经破解了一些代码，以回应另一个similar problem来提出这个解决方案：

def paginate(iterable, page_size):
    while True:
        i1, i2 = itertools.tee(iterable)
        iterable, page = (itertools.islice(i1, page_size, None),
                list(itertools.islice(i2, page_size)))
        if len(page) == 0:
            break
        yield page

index = 0
for page in paginate(response_ids, 1):
    result = api.get_status(response_ids[index])._json
    index += 1

使用tweepy获取具有特定状态ID的推文

2 个答案: