我有一个带基因名称的载体,载体中的几个元素包含多个基因名称,用逗号分隔。我如何分离这个向量的元素并获得一个长向量,每个基因名称作为向量的一个单独元素?我试过strsplit,但只是给我两个或多个基因名称作为分隔的字符串,但仍然在向量的相同元素... / Frida
genes = c("PGD", "CDA", "MROH7,TTC4", "PGM1")
我希望将元素"MROH7,TTC4"
分成两个元素"MROH7"
和"TTC4"
答案 0 :(得分:9)
这将在每个逗号分隔您的字符串:
genes = c("PGD", "CDA", "MROH7,TTC4", "PGM1")
genes.split = unlist(strsplit(genes, ","))
genes.split
[1] "PGD" "CDA" "MROH7" "TTC4" "PGM1"
答案 1 :(得分:4)
另一个选项是scan
,它也会占用空格。
scan(text=genes, what='', sep=',', strip.white=TRUE)