我正在构建一个刮板,用于在reddit注释中搜索关键字。我有两个问题 问题1.为了建立评论林,我需要从评论中获取submission_id,以便我可以提取与该提交有关的所有评论。我在弄清楚如何获取提交ID时遇到了麻烦。
问题2。由于某些原因,每次我运行此代码时,它都会给我包含关键字的新注释(我假设这只是因为添加了新注释),但是在我运行时会出现一些旧注释再次输入代码。这应该从subreddit中拉出所有与我的关键字匹配的注释。我在做什么错了?
from psaw import PushshiftAPI
from datetime import datetime, timezone, timedelta
from dateutil.relativedelta import relativedelta
api = PushshiftAPI()
comments = api.search_comments(q='OP', subreddit='askreddit')
max_response_cache = 1000
cache = []
commentcount = 0
for c in comments:
cache.append(c)
commentcount += 1
print (f' comment {commentcount}: {c.body}')
我希望代码打印出与注释相关的提交ID,并且希望能够提取所有与关键字匹配的注释。