标签: apache-pig
是否有一种计算效率高的方法来查找列中的前2个条目而不仅仅是顶级条目?
感谢。
答案 0 :(得分:0)
根据列的大小,您可以做两件简单的事情:
运行最大一次,删除max元素,再次运行max,然后你有第二个最高值。
或者,您可以对数据进行排序或使用最大堆来存储它。排序数据更易于使用。
对于小型数据集,第一种方法将更有效。对于较大的集合,在找到所需的值之前对它进行排序更有意义。