有人知道实现的样子吗?我有一个猜测;如果我错了,请纠正我:
select
ENAME,SAL,dense_rank() over (order by SAL) DEN_RANK
from
EMP;
假设蜂巢正在绘制一堆地图,而reduces数据在某个时候将按SAL
进行排序,对吧?但是,数据可能足够大,可以散布在多个HDFS块中(将对每个块进行排序,是的)。我假设配置单元rank / dense_rank负责管理HDFS块的迭代,以便它按照遵守排列顺序的方式依次访问一个块的每一行,然后依次访问另一行。这个假设正确吗?