下面显示了一个数据文件的一部分,我可以使用ggplot2创建图表。 使用headers = TRUE和stringsAsFactors = FALSE读入文件。然后:
respiration$Time<-as.numeric(respiration$Time))
ggplot(data=respiration,aes(x=Time,y=as.numeric(as.character(respiration$X0.41_522.2))))+
geom_boxplot(aes(fill=factor(Time)))+scale_fill_manual(values=c("2"='white',"12"='white',"24"='white',"36"='white'))+
geom_jitter(position=position_jitter(width=0.01))+
ggtitle("some compound")+
ylab("Intensity")+xlab("Hours")+theme(legend.position="none")+
scale_y_continuous(limits=c(0,4E7))+
scale_x_continuous(limits=c(0,40))+
stat_summary(aes(group=factor(Time)),fun.data="mean_cl_boot",colour="red")+
stat_smooth(aes(group=factor(1)),se=FALSE,method="loess")+
theme(panel.grid.minor=element_blank(),panel.grid.major=element_blank())
Genotype Time ID Temperature Treatment 0.41_522.2 0.41_258.11 0.42_527.16 0.42_360.15 0.43_365.1
Salinas 2 7 25 Agar 7687155.049 11175204.68 13230240.69 22774983.56 34439569.05
Salinas 2 8 25 Agar 1713206.815 1746016.676 4502488.407 9063059.137 24629121.47
Salinas 2 9 25 Agar 914071.6085 1124905.211 1904392.406 5194590.864 12827777.79
Salinas 2 10 25 Agar 1347683.743 1499201.037 3585477.632 6917994.766 19634655.68
Salinas 2 11 25 Agar 1605104.23 1538321.506 4204065.255 8621464.214 23870186.29
Salinas 2 12 25 Agar 700952.9606 979183.9824 1807856.593 5420989.584 11947592.7
Salinas 12 7 25 Agar 3146028.898 1969085.431 7448511.299 16657110.41 44682871.81
Salinas 12 8 25 Agar 5386677.411 3846305.708 12236342.92 25169138.26 59950390.63
Salinas 12 9 25 Agar 1286114.635 722906.1406 2794505.637 9481895.382 30506314.05
Salinas 12 10 25 Agar 5354226.033 3386725.041 11784456.5 29645430.51 59248887.66
Salinas 12 11 25 Agar 748492.385 740351.3929 1523802.155 8359841.052 16359084.05
Salinas 12 12 25 Agar 858499.9758 575103.9487 1905007.092 8912330.085 18842273.56
Salinas 24 7 25 Agar 667094.93 303363.0331 1163334.585 3157785.164 12044157.87
Salinas 24 9 25 Agar 530456.9694 301920.1723 506135.6222 2265239.959 5893314.03
Salinas 24 10 25 Agar 858462.6456 456174.4145 555120.596 3299599.66 5523333.797
Salinas 24 11 25 Agar 692168.542 298962.6992 750788.6791 2603185.012 7824435.531
Salinas 24 12 25 Agar 4889407.02 863217.2961 4043759.224 13581223.81 20775934.23
Salinas 36 7 25 Agar 694220.2582 1032292.333 1122184.33 1934143.562 4981677.673
Salinas 36 8 25 Agar 298106.1061 264547.3778 269777.3095 800179.5481 1752898.77
Salinas 36 9 25 Agar 129491.3269 262669.2395 921.6464545 534094.1204 968189.6005
Salinas 36 10 25 Agar 244119.2273 268969.6876 267995.1597 703121.8463 2017272.657
Salinas 36 11 25 Agar 80468.06667 2873.859524 2873.859524 2873.859524 2873.859524
Salinas 36 12 25 Agar 232242.6907 905.4295936 905.4295936 511567.7204 1541946.598
这是我想要的情节的基本格式。但是,我愿意 喜欢在我的研究中使用所有治疗方法,如数据子集所示 下面。每个样本的数据开始之前有5个标识列。 其中三个标识列:基因型,温度和治疗 两个级别:Salinas或RNAi,25或35,以及琼脂或ABA。我是什么 我想做的是保持x轴和y轴相同,但绘制每个 治疗方法,每种组合共有8种,同样 图形。例如:在当时的时间过程中,萨利纳斯在Agar上25岁 柱。接下来的治疗萨利纳斯在35岁的琼脂等等.ID栏就是 用于计算每个班级的重复数。
Genotype Time ID Temperature Treatment 0.41_522.2 0.41_258.11 0.42_527.16 0.42_360.15 0.43_365.1 0.43_202.17
RNAi 2 7 25 ABA 5039 7422 8679 49576 90494 618738
RNAi 2 7 25 Agar 1516 3683 2343 25396 32525 892735
RNAi 12 7 25 ABA 170 1656 579 11413 24518 277258
RNAi 12 7 25 Agar 2531 3632 3292 37569 86284 2303883
RNAi 24 7 25 ABA 1094 6791 5 40115 79347 1220589
RNAi 24 7 25 Agar 1247 1518 2146 12985 28139 2650504
RNAi 36 7 25 ABA 2276 16383 4987 94464 231996 1336160
RNAi 36 7 25 Agar 331 8 8 3925 11779 4554882
RNAi 2 7 35 ABA 1598 7257 5005 23631 76097 2441766
RNAi 2 7 35 Agar 2274 9542 8307 43152 133585 2541899
RNAi 12 7 35 ABA 1039 7630 4486 13465 93716 2146027
RNAi 12 7 35 Agar 2946 6497 5338 20105 64423 299289
RNAi 24 7 35 Agar 151 2998 132 1720 8079 1283399
RNAi 36 7 35 ABA 4 9409 1109 4342 22157 10843
RNAi 36 7 35 Agar 2 5967 255 3150 10983 1425159
Salinas 2 7 25 ABA 2128 2650 6294 19401 55034 2258538
Salinas 2 7 25 Agar 27630 40168 47554 81862 123789 217905
Salinas 2 7 35 ABA 305 2759 1136 4056 13781 778439
Salinas 2 7 35 Agar 395 2181 1497 4580 19018 765146
Salinas 12 7 25 ABA 488 3 1585 13856 29628 2376100
Salinas 12 7 25 Agar 11308 7078 26773 59872 160607 77740
Salinas 12 7 35 ABA 674 5755 2193 8081 30457 1611051
Salinas 12 7 35 Agar 397 3477 1419 6182 19834 1090362
Salinas 24 7 25 ABA 1409 3608 1815 31308 68367 1149736
Salinas 24 7 25 Agar 2398 1090 4181 11350 43291 646527
Salinas 24 7 35 ABA 383 4609 1616 3911 17137 1167969
Salinas 24 7 35 Agar 12965 52846 41744 27943 60272 427210
Salinas 36 7 25 ABA 152 3 324 8745 16137 1271203
Salinas 36 7 25 Agar 2495 3710 4034 6952 17906 841374
Salinas 36 7 35 ABA 30222 57212 90224 41898 96592 497250
Salinas 36 7 35 Agar 243 5029 1073 3811 9889 1119949
我不完全确定哪些功能或功能组合
应该用我的数据和图表来实现这一点。我第一次尝试
reshape()并融化了数据,但这丢失了所有个别样本
课堂信息。
我知道我必须根据每个因素对数据进行子集化
水平,但一直无法找到与我一样多的因素。
非常感谢您的帮助或指导。
确定。感谢您提供的反馈意见。到目前为止,我已经使用了你建议的代码,并没有达到理想的解决方案。
我会尝试做出我想要做的更清楚的事情。 在我发布的第一个数据集中,只有1种治疗方法的数据 - 基因型:Salinas,温度:25,治疗:琼脂。将其绘制为单个化合物(列)的单个箱线图系列,在连续的x轴上一次一个,时间。该处理可缩写为S25Ag(Agar上25度的Salinas)。
发布的第二个数据块有8种治疗组合,使用与上述相同的缩写方法:
S25Ag (Salinas at 25 degrees on Agar)
S35Ag
S25ABA
S35ABA
R25Ag (RNAi at 25 degrees on Agar)
R35Ag
R25ABA
R35ABA
对于每种化合物(色谱柱)测量,这些处理组合中的每一种都具有2-36小时(4个时间点)的全时过程。
我要做的是在连续的时间x轴上为单个化合物(列)制作单个图,其中所有八个处理同时作为箱图绘制。
我想用这个解释做什么更清楚了吗?