我试图从subreddit中删除所有评论。我找到了一个名为PRAW的图书馆。它给出了一个例子
import praw
r = praw.Reddit('Comment parser example by u/_Daimon_')
subreddit = r.get_subreddit("python")
comments = subreddit.get_comments()
然而,这仅返回最近的25条评论。如何解析subreddit中的所有注释?在Reddit界面上,有一个next
按钮,因此应该可以逐页返回历史记录。
答案 0 :(得分:2)
来自the docs:
有关完整用法,请参阅UnauthenticatedReddit.get_comments()。
该函数有* args和** kwargs,函数说明:
其他参数直接传递给get_content()。注意:url参数不能更改。
因此,我查看了该功能(找到它here)。 get_content
的一个论点是 limit 。
limit - 要获取的内容条目数。如果限制< = 0,则获取您帐户的默认值(未经身份验证的用户为25)。 如果limit为None,则获取尽可能多的条目(reddit每个请求最多返回100个,但是,PRAW会根据需要自动发出其他请求)。
(强调补充)。所以我的测试是:
comments=subreddit.get_comments(limit=None)
我得到了30多条评论(可能是100条限制,但我必须手动完成它们,所以我认为30条评论已经足够了。)