我可以使用reddit api获取超过1000张图像吗?

时间:2013-02-25 23:54:08

标签: python api web-scraping reddit

我已经编写了一个reddit图像处理程序,而reddit API只允许我使用最新的1000张图像。有谁知道我是否可以支付额外费用以获得更多数据(达到数十万),或者解决此问题的免费解决方法?

1 个答案:

答案 0 :(得分:4)

  

reddit API只允许我使用最新的1000张图片

我认为你的意思是列表只能追溯1000个提交。这是一个适用于除http://www.reddit.com/new之外的所有reddit列表的硬限制(据我所知)。目前,没有选择支付额外的 API访问权限。但是,假设您服从reddit's API rules,您可以使用http://www.reddit.com/new列表返回到您想要的位置,只需过滤掉您不关心的subreddits。

这是一个简单的PRAW示例,它计算在过去10000次提交中对一组子编辑提交的提交数量(运行大约需要200秒)。

import praw
r = praw.Reddit('stackoverflow question test')
subs = set(['aww', 'funny'])

count = 0
for submission in r.get_new(limit=10000):
    if submission.subreddit.display_name.lower() in subs:
        count += 1
print(count)