我正在尝试解析reddit评论以及对每条评论的回复。但是,我试图避免使用PRAW。这是我现在的代码,用于显示subreddit中每个帖子的标题。但是,如何访问评论字段及其回复?
import requests
import json
r = requests.get('http://www.reddit.com/r/wallstreetbets/new.json?count=500', headers = {'User-agent': 'Chrome'})
r_comments = requests.get('https://www.reddit.com/r/wallstreetbets/comments.json')
theJSON = json.loads(r.text)
theJSON_comments = json.loads(r_comments.text)
titles = []
#print(theJSON)
#prints the titles
for child in theJSON['data']['children']:
titles.append(child['data']['title'])
#print(child['data']['title'])
for child2 in theJSON_comments['data']['children']:
print(child2['data'][0])
答案 0 :(得分:0)
如果你正在使用praw并希望获得所有评论,你可以获得所有这样的评论:
submission = reddit.submission(id=<submission_id>)
submission.comments.replace_more(limit=None)
all_comments = submission.comments.list()
然后all_comments
是你可以使用的词典。不是json,但可以保存为json文件。
如果您不想使用praw,可以使用您想要的任何语言手动使用reddit api。但是,我有blog post说明如何在Javascript中设置它。
我认为PRAW会真的帮助你,但是reddit api是你最好的选择。