我目前正在使用praw进行reddit抓取工作以进行某些数据挖掘。我想从subreddits抓取注释和提交,然后将它们保存在数据库或文件中,最好以json格式保存,以便以后使用。 我在尝试将注释和提交对象序列化为python中的JSON对象时遇到问题。是否有现成的方法或方法来做到这一点? 注意:我对python也很陌生。
提前感谢您的帮助!
答案 0 :(得分:3)
更新---------
看起来这已经不可能了,帽子提示Antoine
我不确定是否有办法序列化您需要的内容,但您可以使用以下方法保存提交ID:
some_id = sub.id
然后使用
检索它们r.get_submission(submission_id=some_id)
编辑-----------------------------------------
做了一些研究,发现了这个:https://github.com/praw-dev/praw/issues/271
所以基本上你可以打开存储json:
r.config.store_json_result = True
然后,您可以使用评论或提交的json_dict成员访问json数据。