ElasticSearch中_source字段对大型文档(提取的PDF书籍,文档等)的影响是什么?

时间:2015-12-11 20:52:43

标签: performance elasticsearch

我查看了_source字段,该字段将每个文档都包含在Elasticsearch中。 _source字段似乎是stored字段。

关于我_source字段存储我提交的文档的所有字段,我有一个问题,因为我提交的文档正文是非常大的文本块

问题

如果文档流的速度也可能非常大,那么,如果存储字段的大量文本会以负面方式影响segment merges或影响indexing吗?

使用喂养过程(特别是正文)暂存_source字段的内容是一个更好的选择,这样我就可以对模式更改进行重新摄取(这被认为是优势拥有_source字段。

1 个答案:

答案 0 :(得分:0)

_source 字段是将Solr与Elasticsearch区分开来的其中一项。在Elasticsearch中,它的存在是为了使开发人员的工作更轻松。但它确实有成本和权衡。不过,你可以关闭这个领域,并放弃这些优势。

另一方面,Solr对每一步都更加明确(冗长),但你也可以选择更细化的权衡。

尽管语法差异很大,但索引和搜索实际上非常相似。