应用R

时间:2019-01-28 06:36:46

标签: r aggregate

我有一个包含500行和20000列的数据框,它在行中具有重复的样本ID,最后一列包含标签。当我合并重复的ID时也会影响标签列。我的数据框就像:-

df
sample_name   E002.c1   E004.c1  E005.c1  E007.c1  so on... label
T4456-C        0           0        0        0               GB
T4456-C        1           0        0        1               GB
T4456-C        1           0        1        1               GB
T9589-C        0           1        0        0               LG
T9589-C        1           1        0        0               GB

这是代码:-

aggregate(. ~ sample_name, data = df, max)

此代码将给出结果:-

 sample_name   E002.c1   E004.c1  E005.c1  E007.c1  so on... label
  T4456-C        1           0        1        1               3
  T9589-C        1           1        0        0               2

我想合并这些行,但要基于行名和标签。此代码合并了行,但忽略了标签,还以数字形式转换了标签名。需要什么修改?

预期输出:-

sample_name   E002.c1   E004.c1  E005.c1  E007.c1  so on... label
T4456-C        1           0        1        1               GB
T9589-C        0           1        0        0               LG
T9589-C        1           1        0        0               GB

0 个答案:

没有答案