Google的Dremel算法支持top-k查询。有人能告诉我top-k查询使用的算法吗?
答案 0 :(得分:1)
在O(nlogk)时间内,可以使用堆来回答查询排序列表中的前k个元素的查询。
答案 1 :(得分:0)
我想您知道Dremel纸吗?
以下是链接:https://static.googleusercontent.com/media/research.google.com/en//pubs/archive/36632.pdf
它说:
一些Dremel查询(例如top-k和count-distinct)返回 使用已知的一遍算法(例如[4])获得近似结果。
参考如下:
[4] Z. Bar-Yossef,T。S. Jayram,R。Kumar,D。Sivakumar和 L. Trevisan。计算数据流中的不同元素。在 RANDOM,第1-10页,2002年。
有帮助吗?