我对一个简单的问题有一个快速的问题。在以下代码中,geom ='errorbar'
是什么意思? R使用什么算法来计算误差线?我无法在网上找到它并希望在这里找到答案。
ggplot
stat_boxplot(aes(group = interaction(x, y)),geom ='errorbar', width = 0.6, size=0.75, color="black")
整体代码如下
ggplot(df, aes(x=x,y=y,fill = factor(z))) +
geom_boxplot(aes(fill = factor(z)),outlier.shape=NA, size=1, width = 0.6, fatten = 1, color="black") +
stat_boxplot(aes(group = interaction(x, y)),geom ='errorbar', width = 0.6, size=0.75, color="black")
此外,有没有办法用类似的代码显示最小值和最大值?
谢谢!
答案 0 :(得分:0)
geom_errorbar
只需要一些名为ymin
和ymax
的值并连接它们。在您的示例中,生成这些值的是stat_boxplot
。
?stat_boxplot
:
描述
箱线图紧凑地显示连续的分布 变量。它可视化五个汇总统计数据(中位数,两个 铰链和两个胡须),以及所有"外围"单独指出。
...
摘要统计
下铰链和上铰链对应于第一和第三四分位数 (第25和第75百分位数)。这与方法略有不同 由boxplot函数使用,并且对于小样本可能是明显的。 有关铰链位置的更多信息,请参见boxplot.stats 为箱线图计算。
上部晶须从铰链延伸到最大值no 距离铰链的1.5 * IQR(IQR是四分位数) 范围,或第一和第三四分位数之间的距离)。较低的 晶须从铰链延伸到最小值1.5 * IQR 铰链超出胡须末端的数据被称为 "外围"点和单独绘制。
在缺口框图中,凹口延伸1.58 * IQR / sqrt(n)。这个 给出了比较中位数的大约95%置信区间。看到 麦吉尔等人。 (1978)了解更多细节。
...
计算变量
...
ymin lower whisker =最小观察值大于或等于 下铰链 - 1.5 * IQR
...
ymax上晶须=最大观察值小于或等于 上铰链+ 1.5 * IQR