如果我有常规网址,我一直在寻找从Blogger博客获取评论的方法。我知道你可以通过抓取html来获取blogID,这有点令人不愉快,但有一些标准的方法来获取它。问题是,如果我只有帖子URL和blogID,我就无法找到获取特定帖子评论的方法。据我所知,无法从HTML中可靠地删除postID,并且看起来需要postID来获取单个帖子的评论。
此外,获取blogID API调用的最新帖子仅在帖子是最新的10或15之一时才有用,所以如果它是稍微过时的帖子,我可能无法使用该选项。有没有人知道这样做的好方法?我主要是在寻找一个java解决方案,但是如果有一个不同语言的解决方案,我很乐意将它移植到java。
答案 0 :(得分:1)
我只想记录我的发现,因为这个问题似乎经常被问到并且很少回答。
基本上,要获得单个博客URL的评论,您需要postID。如果您有postID,则可以浏览Blogger API。如果您只有帖子的URL,似乎只有一个可靠的选项,寻找默认的帖子评论Feed。要找到它,您需要查找表单
的html标记
特别是,适用于此的java正则表达式是:
Pattern p = Pattern.compile("http://.*/feeds/[0-9]+/comments/default");
如果此链接标记不存在,则该博客可能会安装第三方评论系统,如Disqus,Echo或Disqus。