Question

我有一个包含500行和20000列的数据框，它在行中具有重复的样本ID，最后一列包含标签。当我合并重复的ID时也会影响标签列。我的数据框就像：-

df
sample_name   E002.c1   E004.c1  E005.c1  E007.c1  so on... label
T4456-C        0           0        0        0               GB
T4456-C        1           0        0        1               GB
T4456-C        1           0        1        1               GB
T9589-C        0           1        0        0               LG
T9589-C        1           1        0        0               GB

这是代码：-

aggregate(. ~ sample_name, data = df, max)

此代码将给出结果：-

 sample_name   E002.c1   E004.c1  E005.c1  E007.c1  so on... label
  T4456-C        1           0        1        1               3
  T9589-C        1           1        0        0               2

我想合并这些行，但要基于行名和标签。此代码合并了行，但忽略了标签，还以数字形式转换了标签名。需要什么修改？

预期输出：-

sample_name   E002.c1   E004.c1  E005.c1  E007.c1  so on... label
T4456-C        1           0        1        1               GB
T9589-C        0           1        0        0               LG
T9589-C        1           1        0        0               GB

应用R

0 个答案: