elasticsearch有几个用于提交文档的API(http,thrift,memcached)。根据所使用的资源提交文档的最有效方法是什么?
我的用例即将拥有相当密集的文档流。将文件打包到多部分表单(而不是执行PUT)是一种资源浪费。 AFAIK thrift还重新处理所有文件以将其打包到节俭运输中。可能是类似memcached的API更有效吗?
答案 0 :(得分:0)
这取决于你的情况。至少有两种方式:
在搜索后端之前进行文档提取。然后做HTTP PUT。节省流量。
您可以将数据传输外包给不同的机制(NFS / HTTP PUT / FTP /无论如何)。传递数据后,可以使用FS River导入。