我遇到了问题,希望有人帮助我。
我有一个包含成分数据的数据集,对于160周的每个工作日,测量汽车的比率。三个比率之和总计为1.本研究中有三种类型的汽车。
我的任务是构建平均值和错误栏'。我在R中使用了以下代码行:
Day = rep(c("Sunday","Monday","Tuesday","Wednesday","Thursday","Friday",
"Saterday"),3)
cars = c(rep("nissan",7),rep("toyota",7),rep("bmw",7))
y <- colMeans(datadag,na.rm=TRUE)
delta <- apply(datadag,2,sd,na.rm=TRUE)
df=data.frame(Day,cars,y,delta)
p<-ggplot(df,aes(x=Day,y=y,group=Device,color=Device))+
geom_point() +
geom_errorbar(aes(ymin=y-delta,ymax=y+delta),width=.6)
print(p)
上面的代码给出了以下图表:
我面临的问题是错误界限超过0和1,由于组成数据,这是不可能的。谁能告诉我我做错了什么?
答案 0 :(得分:1)
您的问题是统计性的,与R无关。您假设标准偏差将“知道”您的数据不能为负数。请考虑以下事项。
foo <- c(0,0,1,1000)
mean(foo) - sd(foo)
[1] -249.5836
我不确定标准错误是否会出现同样的问题,但我怀疑它可以......