弹性搜索引擎无需保存数据

时间:2015-08-10 20:19:56

标签: lucene elasticsearch

Elastic / Lucene 真的是否需要将所有索引数据存储在文档中?难道你不能通过它传递数据以便Lucene may index the words into its hash table并且每个文档都有一个字段,其中包含URL(或者指针对你有意义),它返回每个文档来自哪里从?

一个简单的例子可能是索引Wikipedia.org。如果我将每个网页传递给Elastic / Lucene进行索引 - 如果Lucene将其编入索引并且有相应的URL字段来回复搜索,为什么我需要在一个字段中保存每个网页的主要文本?

我们付出了太多的钱来存储如此多的冗余数据 - 我只是想知道为什么如果Lucene从其哈希表中搜索而不是实际字段我们将数据保存到...为什么保存那些数据如果我们不想要它?

有没有办法在Elastic中索引全文文档而无需保存这些文档中的所有全文数据?

1 个答案:

答案 0 :(得分:1)

_source字段有很多选项。这是实际存储原始文档的字段。您可以完全禁用它或决定保留哪些字段。更多信息可以在文档中找到:

https://www.elastic.co/guide/en/elasticsearch/reference/current/mapping-source-field.html