我必须使用apache nutch设计基于Java / Java EE的搜索引擎。我在互联网上搜索过,我发现很多关于apache nutch安装的文章,但是找不到任何处理java程序的文章/教程来访问或控制apache nutch进行爬行。
答案 0 :(得分:1)
Apache Nutch只会帮助您抓取数据,但您需要将其找到的内容编入索引。这就是Apache Solr的用武之地。然后,您可以编写Java应用程序,使用SolrJ与Solr进行交互。
请参阅this thread了解Nutch和Solr最适合的版本。
答案 1 :(得分:-3)
Nutch将成为你的爬行后端。然后你将使用solr索引,然后你的前端将搜索这个solr索引。请在此处http://www.building-blocks.com/thinking/building-a-search-engine-with-nutch-and-solr-in-10-minutes
查看此链接