索引Wikipedia转储到elasticsearch获取XML文档结构必须在同一实体错误

时间:2015-11-10 12:40:23

标签: xml elasticsearch wikipedia

我想将维基百科索引到elasticsearch。

我尝试了stream2es + elasticsearch 2.0.0 和Wikipedia River Plugin 2.6.0 + elasticsearch 1.6.0 索引最新的维基百科转储https://dumps.wikimedia.org/enwiki/20151102/enwiki-20151102-pages-articles-multistream.xml.bz2

但是两者都有相同的错误消息:

XML document structures must start and end within the same entity.

0 个答案:

没有答案