转换R表避免重复

时间:2018-05-29 15:19:58

标签: r

我有一个基因列表,其中一个属性与2列表相关联。我想要的是改变这个表:

Gene    person
TMCS09g1008676  mathias
TMCS09g1008677  leonard
TMCS09g1008678  marcus
TMCS09g1008679  jan
TMCS09g1008680  jose
TMCS09g1008676  jose
TMCS09g1008677  marcus

在此:

Gene    person
TMCS09g1008676  mathias_jose
TMCS09g1008677  leonard_marcus
TMCS09g1008678  marcus
TMCS09g1008679  jan
TMCS09g1008680  jose

有人知道在R中做到这一点的方法吗? 提前致谢

1 个答案:

答案 0 :(得分:2)

我们可以通过粘贴进行分组

library(dplyr)
df1 %>%
   group_by(Gene) %>%
   summarise(person = paste(person, collapse="_"))

或使用base R

aggregate(person ~ Gene, df1, paste, collapse='_')