当我们谈论倒排索引时,我们总是谈论索引非结构化文本文档。但是ElasticSearch中的文档是JSON格式的,它们是" key" - " value"对。所以我想知道JSON文档的倒排索引是什么样的。换句话说,当我们进行搜索时,例如"从表中选择*,其中name = john",ES会做什么?
答案 0 :(得分:1)
inverted index基本上存储了术语与找到它们的文档/字段之间的关系。现在,这些术语可以来自非结构化文本,但不仅仅是。 JSON文档还包含ES分析和索引的文本。
基本上,从30000英尺的角度来看,它的工作方式是ES解析它收到的JSON文档,遍历所有字段并分析/标记所有这些字段的值。然后,从该分析过程中得到的标记被索引到倒排索引中。
长话短说,它不必是非结构化文本,它被索引到一个倒排索引,它也可以是一个JSON文档等,它也包含结构化的非结构化文本,但也包含数字数字,日期等等。