将Nutch抓取数据索引到Elasticsearch中时出错

时间:2018-08-24 22:20:05

标签: nutch elasticsearch-5

我正在使用Nutch 1.14并试图将一个小型Web爬网索引到ES v5.3.0中,但我不断收到此错误:

<ProductTTTTT>...</Product>

我已经完成this,但仍然收到错误消息...

更新-好的,我已经取得了进展。索引现在似乎可以工作-没有更多错误。但是,当我去查看通过Kibana使用_stats检查文档计数时,当Nutch告诉我这一点时,我得到0:

<Product>...</ProductAAAAAA>

我假设这意味着ES已发送了9个文档用于索引编制?

1 个答案:

答案 0 :(得分:0)

我使用了带有1.14螺母的Elasticsearch 6.0,它的工作原理很像魅力,我在端口9200上使用了 indexer-elastic-rest 插件,我将nutch-site.xml参考。