我想了解如何在ES查询中使用每个lucene索引文件(nvd,dvd,tim,doc ...主要是这四个)。 例如。说我的索引有十个文档,我正在进行聚合查询。我想了解ES / Lucene如何为单个查询执行这四个文件的访问。
我试图看看我是否可以在我的系统中进行一些优化,这主要是一个磁盘重的系统,以加快查询性能。 我查看了ES代码,并了解QueryPhase是最昂贵的,并且它似乎对我所拥有的面向日志的数据进行了大量的随机访问磁盘。
我现在想深入了解lucene级别,并可能调试代码并查看实际操作。 Lucene代码对于IndexReader相关类没有任何日志消息。直接调试lucene代码似乎没有用,因为unittest不用tim,doc,nvd,dvd文件创建索引
任何指针?
答案 0 :(得分:0)
据我所知,ES在搜索细节方面做得不多,如果您想要优化搜索,我的经验是优化您的数据布局,这里有一些重要的lucene文件描述:
有一点可以选择性能: