R使用Stata定义计算百分位数

时间:2016-05-12 14:26:43

标签: r stata definition percentile

我做了两个不同的分析。一个是R,另一个是Stata,基于百分位计算。然而,由于R和Stata之间的百分位数方法计算不同,我在两个结果之间存在不匹配。你知道我是否可以在R?中使用Stata的百分位数定义?

1 个答案:

答案 0 :(得分:3)

R至少有9个分位数的定义,百分位数只是quantile(.) * 100 This link表示相应的分位数 - typetype=4。我无法找到Base Stata手册中记录的百分位数或分位数函数,但如果出错,我会欢迎更正。

Nick Cox是对的。概率为0.25的分位数(数据域中的值)是第25百分位数。 R-Stata鸿沟的两个方面似乎都不清楚这个问题,因为R中的原始努力是以ecdf函数以未指定的方式完成的。幸运的是,通过指向R分位数函数,海报很满意。

在查看Version 13 Stata Manual section on centile后,我不确定它是否与任何R分位数方法匹配,尽管它似乎与类型= 4方法匹配的百分位数远离“极值”:

  

默认情况下,centile估算varlist和for中变量的Cq   以centile(numlist)给出的q值。它不对X的分布做出假设,并且如果需要,在相邻样本值之间使用线性插值。极端的百分位数(例如,小于100的样本中的第99百分位数)固定在最小或最大样本处   值