我有一个包含500行和20000列的数据框,它在行中具有重复的样本ID,最后一列包含标签。当我合并重复的ID时也会影响标签列。我的数据框就像:-
df
sample_name E002.c1 E004.c1 E005.c1 E007.c1 so on... label
T4456-C 0 0 0 0 GB
T4456-C 1 0 0 1 GB
T4456-C 1 0 1 1 GB
T9589-C 0 1 0 0 LG
T9589-C 1 1 0 0 GB
这是代码:-
aggregate(. ~ sample_name, data = df, max)
此代码将给出结果:-
sample_name E002.c1 E004.c1 E005.c1 E007.c1 so on... label
T4456-C 1 0 1 1 3
T9589-C 1 1 0 0 2
我想合并这些行,但要基于行名和标签。此代码合并了行,但忽略了标签,还以数字形式转换了标签名。需要什么修改?
预期输出:-
sample_name E002.c1 E004.c1 E005.c1 E007.c1 so on... label
T4456-C 1 0 1 1 GB
T9589-C 0 1 0 0 LG
T9589-C 1 1 0 0 GB