我有一张桌子,上面有40个紫胶排,有一个列' playcount'最小值为1,最大值约为17,000。
我想将此表格拆分为15个组,方法是添加一个基于' playcount'的值为1到15的列。列。
Hive有一个NTILE函数可以做类似的事情。在这里,如果我做NTILE(15) OVER (ORDER BY playcount) AS mygroup
,它确实将其分解,但是基于playcount值的计数,并且因为较低的值更多(超过50%的值小于5),所以分组是这样的35的组值为15(最大值)。
我想根据playcount进行分组,而不是根据playcount值进行分组。
在蜂巢中是否有类似的东西。
由于
答案 0 :(得分:0)
我能想到的一种可能性是playcount%15 as mygroup
。