我想知道elasticsearch用于唯一计数的算法(hyperloglog ++)。
是否可以将精确度阈值设置为特定值,而不考虑内存限制,从而为我提供一个精确到该阈值的唯一计数?
算法是否使用线性计数器达到精度阈值,然后再切换到超日志计数器?
答案 0 :(得分:0)
是的,它在哈希表中使用线性计数,直到精度阈值为止。您还可以在relevant code中看到它。
但也请记住,默认精度阈值为3,000,您最多可以将其设置为40,000。设置较高的值实际上会将其上限设置为40,000。因此,对于更高的基数没有确切的结果。