百分位函数如何在Hive中起作用?

时间:2017-01-19 06:17:07

标签: hadoop hive hiveql

请将输入数据设置为: 68 69 43 54 56 61 69 70 71 72 77 78 79 85 87 88 89 93 95 96 98 99 99 62 66

根据百分位数函数[百分位数(id),0.9]得出输出为97.2

2 个答案:

答案 0 :(得分:3)

如果你输入0.9,你希望你给函数的90%数据都在返回值之下。 25%中的90%约为22.5,97.2可以是正确答案,因为四个最高值在您的集合中为99 99 98 96,97.2在第22(96)和第23(98)个有序数字之间。

答案 1 :(得分:1)

除了Andrea Romagnoli的回答之外,我想提一下百分位数的一个常见用法就是找到中值如下:

percentile(id, 0.5)