绘制加权数据时,箱线图失去“箱形”性质

时间:2018-06-27 15:08:30

标签: stata boxplot weighted-graph

我在Stata中有以下数据:

input drug  halflife    hl_weight
3       2.95        0.0066
2       6.00        0.0004
5       13.60       0.0006
1       2.82        0.0331
4       8.80        0.0001
4       1.24        0.0075
2       6.25        0.1123
4       17.20       0.0002
5       14.50       0.0020
4       5.50        0.0016
5       13.30       0.0003
4       8.26        0.0201
4       16.50       0.0103
4       11.40       0.0016
4       5.90        0.0005
4       3.99        0.0100
4       2.80        0.0073
4       3.00        0.0133
4       3.17        0.0061
4       4.95        0.1404
end

我正在尝试使用以下命令创建毒品半衰期的箱线图:

graph box halflife [aweight=hl_weight], over(drug)

当我添加权重选项时,一些结果箱形图由多个点组成,而不是典型的四分位数范围和中位数:

Here is a picture demonstrating the difference in boxplots of Weighted vs Unweighted data.

为什么会发生这种情况,我该如何解决?

1 个答案:

答案 0 :(得分:1)

显然,这是由于加权而发生的。权重更加强调了超出四分位数范围的值。

我认为这里没有什么要修复的。您可以尝试使用nooutsides命令的graph box选项隐藏点,但我不建议这样做。