是否订购了Hive的collect_list?

时间:2015-07-10 20:57:15

标签: hive hiveql

This page说到collect_list:

Returns a list of objects with duplicates.

是否订购了该清单?例如,查询的顺序是什么?

2 个答案:

答案 0 :(得分:2)

内置collect_list无法保证订购,即使您先执行order by(即使确实确保订单,这样做也是如此)方式是浪费时间)。只需使用brickhouse collect;它确保元素有序。

答案 1 :(得分:2)

确保collect_list无法保证订购是正确的。函数sort_array将对结果进行排序:

   select a, b, sort_array(collect_list(c)) as sorted_c
   from the_table
   group by a, b