我正在使用R中的数据框,开头如下:
> head(renamed.Mc.Cd.Ni[2:6])
s_MC13_B2_Cd.Ni s_MC13_B3_Cd.Ni s_MC13_B4_Cd.Ni GENE_ID
9.854759 10.216916 9.722329 GENE:JGI_V11_100009
7.863938 8.075640 7.894878 GENE:JGI_V11_100009
9.448034 9.177245 9.053654 GENE:JGI_V11_100036
9.333245 9.208673 9.159947 GENE:JGI_V11_100036
9.360540 9.374757 9.273236 GENE:JGI_V11_100036
8.983222 9.023339 9.112987 GENE:JGI_V11_100044
正如您所看到的,我有三个柱子,它们可以在治疗时为3种不同的水蚤提供基因表达值。最后一列代表表达的基因。然而,由于使用了多个探针,每个基因存在多于一行。如何获得每个水蚤的每个基因的平均值(第1-3列)?
例如,对于三个水蚤(第1列至第3列)中的每一个,我想要第4列中显示的每个基因的总体平均基因表达。我不能手动操作,因为我有超过60,000个基因探针表达值。 / p>
提前谢谢!
答案 0 :(得分:0)
你的问题似乎是一个直截了当的群体问题,有几个例子已经在SO ...所以这是一个重复,但是,这是一个整洁的解决问题的方法。
{{1}}