Elasticsearch pdf / word文件插入查询

时间:2015-09-21 17:39:15

标签: elasticsearch elasticsearch-plugin

如何将弹性的pdf或word文件作为文档插入。 elasticsearch会存储文件吗?如果是这样,请指出相关文档和相关的一些信息。

1 个答案:

答案 0 :(得分:1)

您可以使用Mapper Attachments plugin提取PDF和Word文档的文本并为其编制索引。我建议在弹性系统之外进行文本提取,然后将文本发送到elasticsearch进行索引。文本提取是一个棘手的过程,在弹性搜索之外,您将有更多的选择提取机制,并且提取库中的错误不会影响弹性搜索的稳定性。