关于Nutch的基本疑虑

时间:2013-08-06 20:26:29

标签: lucene indexing nutch

现在我有一个项目,我需要建立一个搜索引擎,但我不能使用Solr,只有nutch和lucece,而我在论坛搜索时,我发现很多人说nutch做索引,我安装了nutch(1.4)和爬行数据,但意识到我没有索引文件夹或类似的东西,只有被抓取的数据..所以,问题是,nutch实际上索引它爬行的内容还是需要Lucene进行索引和搜索?

PS。对于这个项目,我不能使用Solr,只能使用纯粹的nutch和lucene而且我需要使用Java构建所有内容,所以我真的很困惑当人们说nutch实际上是索引...抱歉我的英文不好,不是我的母语...

2 个答案:

答案 0 :(得分:0)

Lucene用于Nutch的索引和搜索。据我所知,Nutch将它找到的页面传递给Lucene进行索引。

答案 1 :(得分:0)

Nutch不会为您的数据编制索引,它不会使用Lucene,因此无法创建自己的索引。 Nutch必须将文件传递给Solr才能将其编入索引。

退房:nutch vs solr indexing