我正在尝试运行 SQL 查询以在某个组内的表中查找第 50 个百分位数,但随后我也在同一字段中对结果进行分组。这是我的查询,例如通过 tpch 的国家表:
SELECT
regionkey,
PERCENTILE_CONT(0.5) WITHIN GROUP(ORDER BY regionkey)
FROM "tpch/nation"
GROUP BY regionkey
ORDER BY regionkey
这是一个有效的查询吗?我正在尝试通过运行各种不同的百分位查询来对我的代码进行质量检查。 Postgres 为上述查询返回此结果:
regionkey | percentile_cont
-------------+-----------------
0 | 0
1 | 1
2 | 2
3 | 3
4 | 4
(5 rows)
但我的问题是在现实世界中,有人会尝试运行此类查询吗?我是聚合函数的新手,特别是百分位函数。
答案 0 :(得分:1)
您可以使用 percentile_cont()
来获取某个有序值的百分比。例如,如果您有一个用于该地区的 population
列,那么您可以将人口中位数计算为:
SELECT regionkey,
PERCENTILE_CONT(0.5) WITHIN GROUP (ORDER BY population)
FROM "tpch/nation"
GROUP BY regionkey
ORDER BY regionkey;
在 regionkey
中使用 ORDER BY
是没有意义的。在每一组中,regionkey
只有一个值。因此,PERCENTILE_CONT()
只能返回该值。
但是,它对于几乎任何其他列都非常有用。