我需要显示一些来自Elasticsearch索引的多值字符串字段的唯一术语。字段值以不同的情况存储。但是唯一的术语应该不区分大小写。此任务通过小写值上的项聚合来解决。问题在于,我需要显示的不是小写键,而是用适当的大小写显示它们的原始值(我应该从几个具有相同小写形式的值中选择最常用的值)。
要显示此类标签,我需要准备从小写值到该值的大多数流行的区分大小写形式的字典映射。问题是我不知道如何有效地准备这样的字典。我可以从Elastic index下载所有区分大小写的术语及其计数,并在客户端上计算最受欢迎的表格。但是这种方式看起来无效。
是否有办法主要在弹性方面解决此任务?
我不能使用术语+ top_hits聚合,因为该字段是多值字段。而且这种方式也会导致搜索性能下降。
还有一种标准化文档值的方法,但是每次在索引中出现新文档时都必须这样做。那也将是无效的。
谢谢。