带有stat_smooth的ggplot2- geom_linerange

时间:2012-05-24 14:26:43

标签: r ggplot2

哦明智的:我有一个关于使用geom_linerange()的问题,附件是我希望是一个可行的例子来说明我的问题。

b=c(100,110,90,100,120,130,170,150,150,120,140,150,120,90,90,100,40,50,40,40,20,60,30)
test<-data.frame(a=c(2,2,2,4,4,4,4,6,6,6,6,6,6,8,8,8,10,10,10,10,10,10,10),
                 b=b,c=c(b-15))

testMelt <- melt(
  test, 
  id       = c("a"), 
  measured = c("b", "c")
  )


p <- ggplot(
  aes(
    x    = factor(a), 
    y    = value,
    fill= variable
    ),      
   data  = testMelt) + 
    geom_boxplot() + 
          stat_smooth(aes(group=variable,x=factor(a),y=value,fill=factor(variable)),data=testMelt)

我的实际数据集要大得多,而且箱形图有点压倒性。我想我想要的是使用geom_linerange()以某种方式在“a”的每个值处以“b”和“c”显示数据的范围。

我提出的最好的是:

p<- p+ geom_linerange(aes(as.factor(a),ymin=min(value),ymax=value,color=variable))

我可以假设“c”值总是等于或小于“b”,但如果范围较小,则“覆盖它”。我能以某种方式抖动线条吗?有更好的解决方案吗?

2 个答案:

答案 0 :(得分:2)

geom_linerange来电中,添加其他参数position=position_dodge(width=0.3)。您可以调整绝对宽度以更改垂直线之间的间隔。

enter image description here

答案 1 :(得分:1)

我对这个问题的理解是,您希望行范围反映组合a:b:c的范围。

geom_linerange(aes(as.factor(a),ymin=min(value),ymax=value,color=variable))会将最小值设置为整个数据集最小值(因此所有行都显示相同的最小值。

一些解决方案。

自己计算最小值和最大值

test_range <- ddply(testMelt, .(a,variable), summarize, 
                    val_min = min(value), val_max = max(value))

然后运行

 ggplot(data  = testMelt) + 
    geom_boxplot(aes(x = factor(a), y = value, fill = variable)) + 
    stat_smooth(aes(group = variable, x = factor(a), y = value, 
                    fill = factor(variable))) +
     geom_linerange(data = test_range, aes(x = as.factor(a), ymin = val_min,
                    ymax = val_max, color = variable), 
                    position = position_dodge(width = 0.3))

或者,对于箱线图/线范围的替代方案,请使用小提琴图。

ggplot(data  = testMelt) + 
    geom_violin(aes(x = factor(a), y = value, fill = variable)) + 
    stat_smooth(aes(group = variable, x = factor(a), y = value, 
                    fill = factor(variable)))