我已经编写了一个reddit图像处理程序,而reddit API只允许我使用最新的1000张图像。有谁知道我是否可以支付额外费用以获得更多数据(达到数十万),或者解决此问题的免费解决方法?
答案 0 :(得分:4)
reddit API只允许我使用最新的1000张图片
我认为你的意思是列表只能追溯1000个提交。这是一个适用于除http://www.reddit.com/new之外的所有reddit列表的硬限制(据我所知)。目前,没有选择支付额外的 API访问权限。但是,假设您服从reddit's API rules,您可以使用http://www.reddit.com/new列表返回到您想要的位置,只需过滤掉您不关心的subreddits。
这是一个简单的PRAW示例,它计算在过去10000次提交中对一组子编辑提交的提交数量(运行大约需要200秒)。
import praw
r = praw.Reddit('stackoverflow question test')
subs = set(['aww', 'funny'])
count = 0
for submission in r.get_new(limit=10000):
if submission.subreddit.display_name.lower() in subs:
count += 1
print(count)