我想使用Nick Cox编写的winsor
命令。根据这一页http://www.stata.com/statalist/archive/2011-09/msg01340.html,作者指出,通常的胜利百分位是1/99和5/95。
我是否正确p(0.1)对应于1/99百分位数的胜利?还是p(0.01)? 后者似乎更直观,但是值p(0.5)会产生平均值(在这种情况下没有意义)。
非常感谢。
编辑:很抱歉,我尝试过p(0.5)但它不起作用。因此,我猜p(0.01)对应于1/99和p(0.05)到5/95百分位数。 EDIT2:我很抱歉这个误会。我误解了作者处理异常值的程序(绘制箱图以识别超出的范围) 1/99或5/95百分位数)。答案 0 :(得分:2)
0.1对应于第10和第90百分位的winsorising:
. sysuse auto
(1978 Automobile Data)
. sum price , detail
Price
-------------------------------------------------------------
Percentiles Smallest
1% 3291 3291
5% 3748 3299
10% 3895 3667 Obs 74
25% 4195 3748 Sum of Wgt. 74
50% 5006.5 Mean 6165.257
Largest Std. Dev. 2949.496
75% 6342 13466
90% 11385 13594 Variance 8699526
95% 13466 14500 Skewness 1.653434
99% 15906 15906 Kurtosis 4.819188
. winsor price , p(0.1) gen(wp)
. sum wp, detail
price, Winsorized fraction .1
-------------------------------------------------------------
Percentiles Smallest
1% 3895 3895
5% 3895 3895
10% 3895 3895 Obs 74
25% 4195 3895 Sum of Wgt. 74
50% 5006.5 Mean 5997.432
Largest Std. Dev. 2434.708
75% 6342 11385
90% 11385 11385 Variance 5927804
95% 11385 11385 Skewness 1.294202
99% 11385 11385 Kurtosis 3.29362