查找列中的第二大条目

时间:2012-09-05 17:47:24

标签: apache-pig

是否有一种计算效率高的方法来查找列中的前2个条目而不仅仅是顶级条目?

感谢。

1 个答案:

答案 0 :(得分:0)

根据列的大小,您可以做两件简单的事情:

运行最大一次,删除max元素,再次运行max,然后你有第二个最高值。

或者,您可以对数据进行排序或使用最大堆来存储它。排序数据更易于使用。

对于小型数据集,第一种方法将更有效。对于较大的集合,在找到所需的值之前对它进行排序更有意义。