hive中的percentile_approx返回零

时间:2015-04-01 11:20:57

标签: hadoop hive

我一直在尝试检查一组用户的percentile_approx。这背后的意图是在数据集中获得前25%的客户。因此,为了检查这一点,我运行了以下HIVE查询。

select percentile_approx(amount, 0.75)
from sales

但是,此查询返回的值为0.0。我不确定问题是什么。当我在几个记录的样本上运行此查询时,结果就是预期的结果。

任何人都可以对此有所了解吗?

注意 - 我试图在包含超过3.3 M记录的数据集中找到百分位数。

2 个答案:

答案 0 :(得分:-1)

select percentile_approx(cast(amount as double), ARRAY(0.75))
from sales

试试这个方法

答案 1 :(得分:-1)

通常,percentile_approx()适用于整数类型数据。请确保您已在具有整数的列上应用此项。