从Wordpress博客中检索相关帖子

时间:2014-10-18 22:01:13

标签: wordpress search web-crawler

我需要用Java编写程序来检索包含关键字的所有wordpress网站的所有帖子。 这就是我解决问题的方法。我最初认为我会抓住wordpress网站寻找我感兴趣的关键字。但我意识到如果有wordpress搜索的端点,它使我的工作更容易。所以我四处查看是否有任何搜索端点提交查询并获取帖子的链接。 我发现的只是http://wwww.en.search.wordpress.com。我仍然可以调整网址并获得一些链接。但是

  1. 我想知道是否有更好的方法来处理这个问题
  2. 我发布的搜索链接是针对用户的,可能会限制我的搜索结果,因为我通过程序查询
  3. 此外,我还希望从给定的日期范围中检索帖子。我不确定这种方法是否可行。
  4. 感谢这方面的任何帮助。谢谢。

1 个答案:

答案 0 :(得分:0)

这种方法怎么样:

  • 假设您不需要回到历史记录并废弃所有数据,我会坚持使用标签 http://en.wordpress.com/tags/
  • 我会每天抓取它获取最受欢迎的标签(按字体大小)然后在每个标签上获取过去24小时内发布的文章
  • 在每个帖子上获取所有评论并搜索您的关键字


那会有用吗?如果没有,请分享更多细节
祝你好运