需要一些有关Crawl Anywhere和solr的信息

时间:2013-11-29 07:43:51

标签: solr tomcat7 web-crawler

我在任何文档中都进行了抓取,但我对其安装步骤感到非常困惑。

  1. 我理解的是Apache是​​可选的。但是需要独立的tomcat实例进行爬网吗?因为我在文件夹结构中看到的,有tomcat文件夹已存在并且战争文件也在那里?
  2. 我们还需要Apache solr的独立实例吗?
  3. 如果我们想添加postgresql数据库进行抓取,我们该怎么办呢?
  4. 请提供一些链接,以便我可以仔细阅读并澄清我心中的任何疑问。

1 个答案:

答案 0 :(得分:0)

  1. Apache需要使用管理界面。某些交互式功能需要Tomcat。你可以在没有它们的情况下进行爬行。
  2. 没有
  3. 支持MySQL和MongoDB。代码是开源的,因此您可以添加postgresql支持。
  4. 尝试Google Groups了解其他问题