我正在使用R的泛型函数plot()
来绘制计数数据作为标称变量的函数,其中count
是整数的向量,而colour
是包含两个类别的变量:
varb = c('red','red','red','red','blue','blue','blue','blue')
count = c(3,1,0,2,2,0,6,2)
df = data.frame(varb,count)
plot(count ~ varb, data=df)
我的问题是:误差线代表什么?他们是95%的置信区间吗?标准偏差?标准错误?
谢谢!
答案 0 :(得分:0)
为了更详细地解释,我已经使用了您的代码并添加了标签来进行解释
# Plot your data
plot(count ~ varb, data=df)
# Add text to plot
text(x= 1, y= 6.1, labels= "Largest value")
text(x= 1, y= -0.1, labels= "Smalest value")
text(x= 1, y=2.1, labels= "Median")
text(x= 1, y=4.1, labels= "Upper quartile (75%)")
text(x= 1, y= 1.1, labels= "Lower quartile (25%")
要解释的图像(请注意,我只标记了第一个图)
利用箱线图,我们基于以下总结来可视化数据的分布:最小值(即最小值),第一四分位数(即较低的四分位数),中位数,第三四分位数(即较高的四分位数)和最大值(即,最大价值)。请注意,从第一个四分位数到第三个四分位数的距离代表四分位数间距或IQR(IQR与样本数据的可变性有关)。