我知道对于已分析的字段,Lucene会将该子句标记化,然后将标记存储为用于搜索的倒排索引。但Lucene如何索引Not_Analyzed字段,我不相信它仍然是倒排索引。是BTree还是Hash?
答案 0 :(得分:2)
未分析的字段也以与分析字段相同的方式存储在倒排索引中,它们只是...未分析。这意味着在索引之前,字段值不会被标记化等。
因此,如果您的not_analyzed
字段包含值New York
,那么该值将在反向索引中未经修改且未加标记,您仍然可以搜索包含的文档确切的值。它在某种程度上类似于分析字段为keyword
analyzer