我有一个数据框,该数据框在“符号”列中包含多个逗号分隔的“基因”。这些属于“本体”中的一类。我想将基因分为几行,并保持每一行的本体。 请看我的例子:
我尝试过这样的事情:
reshape(df, direction = "long", varying = list(names(df)[2:2]), v.names = "Symbols", idvar = c("Term"))
在
Term Symbols
GO:0003012 TNNI1,STAC3,FKBP1A
GO:0003013 BDKRB2,CASQ2,COMP,ENO1
退出:
GO:0003012 TNNI1
GO:0003012 STAC3
GO:0003012 FKBP1A
GO:0003013 BDKRB2
GO:0003013 CASQ2
GO:0003013 COMP
GO:0003013 ENO1