向elasticsearch提交文档的最有效方法

时间:2013-05-07 00:02:40

标签: api submit elasticsearch

elasticsearch有几个用于提交文档的API(http,thrift,memcached)。根据所使用的资源提交文档的最有效方法是什么?

我的用例即将拥有相当密集的文档流。将文件打包到多部分表单(而不是执行PUT)是一种资源浪费。 AFAIK thrift还重新处理所有文件以将其打包到节俭运输中。可能是类似memcached的API更有效吗?

1 个答案:

答案 0 :(得分:0)

这取决于你的情况。至少有两种方式:

  1. 在搜索后端之前进行文档提取。然后做HTTP PUT。节省流量。

  2. 您可以将数据传输外包给不同的机制(NFS / HTTP PUT / FTP /无论如何)。传递数据后,可以使用FS River导入。