逆向工程Hive rank / dense_rank函数-蜂巢如何实现rank / dense_rank函数

时间:2018-12-11 04:00:33

标签: hadoop hive mapreduce bigdata ranking

有人知道实现的样子吗?我有一个猜测;如果我错了,请纠正我:

select
   ENAME,SAL,dense_rank() over (order by SAL) DEN_RANK
from
EMP;

假设蜂巢正在绘制一堆地图,而reduces数据在某个时候将按SAL进行排序,对吧?但是,数据可能足够大,可以散布在多个HDFS块中(将对每个块进行排序,是的)。我假设配置单元rank / dense_rank负责管理HDFS块的迭代,以便它按照遵守排列顺序的方式依次访问一个块的每一行,然后依次访问另一行。这个假设正确吗?

0 个答案:

没有答案