我有两个通过重塑原始数据集而创建的R数据帧。数据框之一具有不同“月”的不同“处理”的值。另一个数据框的每个子类别都有“均值”。
> head(gatheredDiameterAndTreatmentData) Treatment Month Diameter 1 Aux_Drop Diameter(inches).Sep 2.2 2 Aux_Spray Diameter(inches).Sep 2.5 3 DMSO Diameter(inches).Sep 2.6 4 Water Diameter(inches).Sep 1.7 5 Aux_Drop Diameter(inches).Sep 1.5 6 Aux_Spray Diameter(inches).Sep 3 > head(subMeans) Treatment Month Diameter 1 Aux_Drop Diameter(inches).Dec 3.292857 2 Aux_Spray Diameter(inches).Dec 2.515385 3 DMSO Diameter(inches).Dec 4.145455 4 Water Diameter(inches).Dec 4.383333 5 Aux_Drop Diameter(inches).Mar 4.600000 6 Aux_Spray Diameter(inches).Mar 4.587500
我使用了代码:
gatheredDiameterAndTreatmentData %>%
subset(Diameter != "NA") %>%
ggplot(aes(x = factor(Treatment), y = Diameter)) +
geom_point(aes(colour = Month), na.rm = TRUE, position = position_dodge(width = 0.2)) +
现在,我还想为每个组添加子装置。但是,当我使用以下代码时,我的图(用于每个类别的子均值)变得非常不同:
gatheredDiameterAndTreatmentData %>% subset(Diameter != "NA") %>% ggplot(aes(x = factor(Treatment), y = Diameter)) + geom_point(aes(colour = Month), na.rm = TRUE, position = position_dodge(width = 0.2)) + geom_point(data = subMeans, size = 4)
平均值为何这么低?我认为缩放没有问题。
另外,我想画一条线来连接不同治疗组在不同月份的平均值吗?
我有一些通过保管箱共享的文件(将数据帧转换为文本文件): https://www.dropbox.com/sh/968nfxd5aisizc5/AACsdybRv-QgigGTmMS_7fc9a?dl=0