使用组合数据构建错误栏

时间:2015-05-12 08:04:12

标签: r ggplot2

我遇到了问题,希望有人帮助我。

我有一个包含成分数据的数据集,对于160周的每个工作日,测量汽车的比率。三个比率之和总计为1.本研究中有三种类型的汽车。

我的任务是构建平均值和错误栏'。我在R中使用了以下代码行:

Day = rep(c("Sunday","Monday","Tuesday","Wednesday","Thursday","Friday",
"Saterday"),3)
cars = c(rep("nissan",7),rep("toyota",7),rep("bmw",7))
y <- colMeans(datadag,na.rm=TRUE)
delta <- apply(datadag,2,sd,na.rm=TRUE)
df=data.frame(Day,cars,y,delta)

p<-ggplot(df,aes(x=Day,y=y,group=Device,color=Device))+
geom_point() +  
geom_errorbar(aes(ymin=y-delta,ymax=y+delta),width=.6)
print(p)

上面的代码给出了以下图表: enter image description here

我面临的问题是错误界限超过0和1,由于组成数据,这是不可能的。谁能告诉我我做错了什么?

1 个答案:

答案 0 :(得分:1)

您的问题是统计性的,与R无关。您假设标准偏差将“知道”您的数据不能为负数。请考虑以下事项。

foo <- c(0,0,1,1000)
mean(foo) - sd(foo)
[1] -249.5836

我不确定标准错误是否会出现同样的问题,但我怀疑它可以......