在箱形图中添加(平均+/- 2西格玛)线

时间:2013-06-17 17:51:25

标签: r statistics

我有一个数据集,我想在R中制作一个箱形图。我能够通过R控制台中的以下命令简单地(这里我只使用了一些示例数据):

x <- rnorm(100);

y <- rnorm(100);

boxplot(x, y, col=rainbow(2))

enter image description here

现在我真正想要的是在上面的boxplot上显示我的数据集的(平均值+/-(2或3)* sigma)标记。我知道标准偏差和平均值不是很稳健的统计数据,但对于我的数据集,这些信息可能很有用。即预期的数字应如下所示:

enter image description here 其中虚线(不同颜色)代表相应的图表'95%或99.7%置信区间或(平均值+/-(2或3)*西格玛)。

N.B。不幸的是我无法在这里添加数据,因为我没有足够的声誉,如果有人可以从上面的链接上传到这里,我们将不胜感激。

1 个答案:

答案 0 :(得分:2)

一些非常简单易行的方法是使用notch=TRUE函数中的boxplot()参数(参见?boxplot)。这与平均值的95%置信区间不完全相同,而是类似于中位数的95%CI(这将解决您对稳健性的担忧)。解释here

  

槽口(如果要求)扩展到+/- 1.58 IQR / sqrt(n)。这似乎   基于与1.57 in的公式相同的计算   钱伯斯等人。 (1983年,第62页),McGill等人给出的。 (1978年,第16页)。   它们基于中值的渐近正态性并且大致相等   两个中位数的样本量被比较,据说是   对样本的基础分布相当不敏感。该   想法似乎是为了给出大约95%的置信区间   两个中位数的差异。