平均数据集中的两行,基于它们在另一列中具有相同的值,

时间:2013-09-25 00:01:59

标签: r

让我们再试一次。这次我尝试包含数据。

我有108行的数据集和654列(图中是8个初始列的样本)。我这里有54个不同的样本,我有两个读数。我想平均每个克隆的吸光度列[6:653](第2列)(克隆的格式为'11 -45-N')。有一个读数A和一个读数B.这些需要平均,然后放入一个新表,这个新表必须保留第1,2,3和654列中的数据(这些单元格用于两个读数) ,但不一定是数字,你可以看到)。例如,新表的第一行中的前3列应与下面示例的第一行完全相同,但不包括“读取和ID”列。请注意,删除这两列纯粹是一种生活质量的东西,我主要要求它获得平均值,并保留其他列中的信息。

我曾尝试使用plyrrollapply函数,但我仍然相对较新,并且无法弄明白。

     Reslevel   clone bagnumber reading ID absorbence.8987.71322 absorbence.8979.99845 absorbence.8972.28367
1           H 11-45-N        16     A.0  1              -1.40435              -1.40512              -1.40558
649         H 11-45-N        16     B.0  2              -1.45466              -1.45544              -1.45590
1297        H  8-23-N        11     A.0  3              -1.42534              -1.42613              -1.42665
1945        H  8-23-N        11     B.0  4              -1.45738              -1.45803              -1.45853
2593        H  8-29-N        11     A.0  5              -1.46860              -1.46937              -1.46987
3241        H  8-29-N        11     B.0  6              -1.44404              -1.44487              -1.44543

1 个答案:

答案 0 :(得分:1)

试试这个:

aggregate(. ~ Reslevel + clone + bagnumber + last_col_name, data=dataset_name, FUN=mean)