我已经在Ubuntu 16.04上启动并运行ElasticSearch 5.3.2,并希望使用Nutch来抓取网站。我已经编译了Nutch 2.3.1并成功抓取了一个网站,但是当我将其编入Elastic时,我会收到错误。
命令:
bin / nutch index -all
输出:
在/var/logs/elasticsearch/elasticsearch.log文件中,我收到此消息:
是否有人知道此错误的含义以及如何解决此问题? THX
答案 0 :(得分:4)
我不认为Nutch 2.3.1已经使用普通的ES Java插件与ES 5.3.2一起工作了。据我所知,目前的Nutch版本刚刚upgraded to ES 2.3.3。
但是,您可以使用indexer-elastic-rest
插件,使用Jest 2.0.3库在HTTP级别与ES交互。
您需要做的就是在Nutch配置文件中配置所有"elasticsearch rest" properties。
答案 1 :(得分:0)
我试过这个,它对我有用 https://github.com/mdigiacomi/indexer-elastic