ggplot stat_summary中位数和boxplot中位数分歧

时间:2015-05-27 17:10:40

标签: r graph ggplot2 statistics

我正在使用这个

ggplot(dfmergedrearrangemelted, aes(x = Var2, y=value)) + geom_boxplot()+
ggtitle("Values and Medians")+xlab(xlabel)+ylab("Magnitude (log10)")+
stat_summary(fun.y = median, geom = "point", position = position_dodge(width = .9),
size = 6, shape = 4, show_guide = F)+
theme(axis.text.x=element_text(angle=90))+
scale_x_discrete(labels=namePosTargetGroupV2)+
scale_y_log10()

制作一系列箱图,我用x到stat_summary分别标记了medans。问题是通过stat_summary的中位数和箱线图中的中心线在所有情况下都不一致。当boxplot的框在log10标度上低于0.1时,往往会发生这种情况。知道原因是什么吗?

1 个答案:

答案 0 :(得分:0)

也许您需要log10(中位数),因为这些是为y轴计算的值。在低值时,可能会看到这些差异,但是在较高值时,对数标度似乎渐近增加X,这意味着 - 任何ΔX,将产生非常小的Δy。