应用错误收集

如何在Hive中实现排序（Order by）？

时间：2012-02-28 04:49:19

标签： sorting hadoop sql-order-by mapreduce hive

我们知道hive在排序作业开始之前不会进行采样。它只是利用MapReduce的排序机制并在reduce方面执行merge-sort，并且只使用一个reduce。因为reduce收集mapper中输出的所有数据这种情况，比如运行reduce的机器有100GB的磁盘，如果数据太大而无法放入磁盘怎么办？

1 个答案:

答案 0 :(得分：0)

Hive的并行排序机制仍处于开发阶段，请参阅here。

精心设计的数据仓库或数据库应用程序将避免此类全局排序。如果需要，请尝试使用Pig或Terasort（http://hadoop.apache.org/common/docs/current/api/org/apache/hadoop/examples/terasort/package-summary.html）

如何通过内部实现mysql排序？
如何在Hive中实现排序（Order by）？
按列名称降序排序
订单如何运作？
如何实施inout参数？
订单不按预期工作
sort_array由不同的列排序，Hive
MariaDB的ORDER BY子句不按升序排序？
在结果中排序或排序没有列
如何按降序对实现的列表数据结构进行排序？

我写了这段代码，但我无法理解我的错误
我无法从一个代码实例的列表中删除 None 值，但我可以在另一个实例中。为什么它适用于一个细分市场而不适用于另一个细分市场？
是否有可能使 loadstring 不可能等于打印？卢阿
java中的random.expovariate()
Appscript 通过会议在 Google 日历中发送电子邮件和创建活动
为什么我的 Onclick 箭头功能在 React 中不起作用？
在此代码中是否有使用“this”的替代方法？
在 SQL Server 和 PostgreSQL 上查询，我如何从第一个表获得第二个表的可视化
每千个数字得到
更新了城市边界 KML 文件的来源？