我有限的理解是分位数和四分位数是某种类似但完全不同的测量方式。我用谷歌搜索,但找不到一个易于理解的解释。有D3 related question here但尚无答案。
我的具体问题是我们应该使用分位数而不是四分位数,反之亦然?我很欣赏任何非专业术语解释或琐碎的例子。谢谢!
答案 0 :(得分:2)
累积密度函数为您提供随机变量达到或低于某个值的概率。
分位数函数与此相反。即你给它一个概率,它告诉你随机变量值。
所以中位数是概率值为0.5时的分位数值。
四分位数是概率为0.25,0.5和0.75的分位数的值。
因此,通常,您可以使用分位数。 四分位是一个特例。
答案 1 :(得分:2)
来自维基百科:
分位数是从随机变量的累积分布函数(CDF)的倒数以规则间隔获取的值。将有序数据划分为q个基本上相等大小的数据子集是q分位数的动机;分位数是标记连续子集之间边界的数据值。
4分位数称为四分位数。