在蜂巢中以等份分割一系列数字

时间:2016-09-29 05:59:09

标签: hadoop hive

我有一张桌子,上面有40个紫胶排,有一个列' playcount'最小值为1,最大值约为17,000。

我想将此表格拆分为15个组,方法是添加一个基于' playcount'的值为1到15的列。列。

Hive有一个NTILE函数可以做类似的事情。在这里,如果我做NTILE(15) OVER (ORDER BY playcount) AS mygroup,它确实将其分解,但是基于playcount值的计数,并且因为较低的值更多(超过50%的值小于5),所以分组是这样的35的组值为15(最大值)。

我想根据playcount进行分组,而不是根据playcount值进行分组。

在蜂巢中是否有类似的东西。

由于

1 个答案:

答案 0 :(得分:0)

我能想到的一种可能性是playcount%15 as mygroup