如何用字符串拆分矢量

时间:2014-05-21 19:39:26

标签: r

我有一个带基因名称的载体,载体中的几个元素包含多个基因名称,用逗号分隔。我如何分离这个向量的元素并获得一个长向量,每个基因名称作为向量的一个单独元素?我试过strsplit,但只是给我两个或多个基因名称作为分隔的字符串,但仍然在向量的相同元素... / Frida

genes = c("PGD", "CDA", "MROH7,TTC4", "PGM1") 

我希望将元素"MROH7,TTC4"分成两个元素"MROH7""TTC4"

2 个答案:

答案 0 :(得分:9)

这将在每个逗号分隔您的字符串:

genes = c("PGD", "CDA", "MROH7,TTC4", "PGM1")
genes.split = unlist(strsplit(genes, ","))

genes.split
[1] "PGD"   "CDA"   "MROH7" "TTC4"  "PGM1" 

答案 1 :(得分:4)

另一个选项是scan,它也会占用空格。

scan(text=genes, what='', sep=',', strip.white=TRUE)