我使用php脚本将一组reddit文章的数据属性抓取到csv中,抓住这些帖子后我需要监控每篇文章'在接下来的24小时内每小时的状态。我有属性标题,ID,名称,评论和域名,但我目前无法使用这些属性找到访问每个/相应的reddit帖子的方法。
有人能告诉我使用其列中的任何数据访问此csv中的每个reddit帖子的方法吗?
答案 0 :(得分:2)
帖子网址中使用id
字段,如下所示:92dd8
变为https://www.reddit.com/comments/92dd8
,相当于https://www.reddit.com/r/pics/comments/92dd8/test_post_please_ignore
(除了缺少subreddit样式)
您还可以将/api/info
与name
字段一起使用:t3_92dd8
变为https://www.reddit.com/api/info?id=t3_92dd8
(如果您希望它为JSON,则可以执行https://www.reddit.com/api/info.json?id=t3_92dd8
,这是/api/info
/api/info
的预期用途,但它仍适用于HTML查看)。请注意,/api/info
仅提供有关链接的信息,而不是对其进行评论,但它仍然有用。 (另外,Cache-Control: no-cache
可以将逗号合并为最多100个帖子:https://www.reddit.com/api/info?id=t3_92dd8,t3_2np694
- 如果您想一次查询大量帖子,这可能很有用。)