如何让Nutch 2.3.1与ElasticSearch 5.3.2一起使用?

时间:2017-04-28 23:56:08

标签: elasticsearch nutch

我已经在Ubuntu 16.04上启动并运行ElasticSearch 5.3.2,并希望使用Nutch来抓取网站。我已经编译了Nutch 2.3.1并成功抓取了一个网站,但是当我将其编入Elastic时,我会收到错误。

命令:

bin / nutch index -all

输出:

nutch-error

在/var/logs/elasticsearch/elasticsearch.log文件中,我收到此消息:

elasticsearch log file

是否有人知道此错误的含义以及如何解决此问题? THX

2 个答案:

答案 0 :(得分:4)

我不认为Nutch 2.3.1已经使用普通的ES Java插件与ES 5.3.2一起工作了。据我所知,目前的Nutch版本刚刚upgraded to ES 2.3.3

但是,您可以使用indexer-elastic-rest插件,使用Jest 2.0.3库在HTTP级别与ES交互。

您需要做的就是在Nutch配置文件中配置所有"elasticsearch rest" properties

答案 1 :(得分:0)

我试过这个,它对我有用 https://github.com/mdigiacomi/indexer-elastic