在google的dremel中,top-k查询使用的算法是什么?

时间:2012-08-06 08:27:25

标签: algorithm dremel

Google的Dremel算法支持top-k查询。有人能告诉我top-k查询使用的算法吗?

2 个答案:

答案 0 :(得分:1)

像堆一样?

在O(nlogk)时间内,可以使用堆来回答查询排序列表中的前k个元素的查询。

请参阅http://stevehanov.ca/blog/index.php?id=122

答案 1 :(得分:0)

我想您知道Dremel纸吗?

以下是链接:https://static.googleusercontent.com/media/research.google.com/en//pubs/archive/36632.pdf

它说:

  

一些Dremel查询(例如top-k和count-distinct)返回   使用已知的一遍算法(例如[4])获得近似结果。

参考如下:

  

[4] Z. Bar-Yossef,T。S. Jayram,R。Kumar,D。Sivakumar和   L. Trevisan。计算数据流中的不同元素。在   RANDOM,第1-10页,2002年。

有帮助吗?