标签: hive sql-order-by window-functions
我从理论上知道答案是随机的,但是我想知道您是否使用例如row_number()进行窗口函数,并且给定分区的按列顺序具有重复的值,结果是否仍然相同?即使没有指定,Hive也会查看其他列以确定顺序吗?
答案 0 :(得分:1)
由于在许多映射器和精简器中并行执行查询处理,因此不能保证重复行的顺序,具体取决于集群和所涉及的每个节点,每个映射器和简化器的执行速度可能较慢,但并不总是相同。即使在单个reducer上,Mapper的结果也可能无法以相同的顺序处理。