我做了两个不同的分析。一个是R,另一个是Stata,基于百分位计算。然而,由于R和Stata之间的百分位数方法计算不同,我在两个结果之间存在不匹配。你知道我是否可以在R?中使用Stata的百分位数定义?
答案 0 :(得分:3)
R至少有9个分位数的定义,百分位数只是。 This link表示相应的分位数 - quantile(.) * 100
type
为type=4
。我无法找到Base Stata手册中记录的百分位数或分位数函数,但如果出错,我会欢迎更正。
Nick Cox是对的。概率为0.25的分位数(数据域中的值)是第25百分位数。 R-Stata鸿沟的两个方面似乎都不清楚这个问题,因为R中的原始努力是以ecdf
函数以未指定的方式完成的。幸运的是,通过指向R分位数函数,海报很满意。
在查看Version 13 Stata Manual section on centile后,我不确定它是否与任何R分位数方法匹配,尽管它似乎与类型= 4方法匹配的百分位数远离“极值”:
默认情况下,centile估算varlist和for中变量的Cq 以centile(numlist)给出的q值。它不对X的分布做出假设,并且如果需要,在相邻样本值之间使用线性插值。极端的百分位数(例如,小于100的样本中的第99百分位数)固定在最小或最大样本处 值