如何在R中基于单词边界拆分字符串?

时间:2016-10-12 21:43:46

标签: r regex

如何根据R中的空格/字边界分割字符串?

t = "ID=gene:Bra032485;biotype=protein_coding;description=AT5G40170 (E%3D6e-176) AtRLP54 | AtRLP54 (Receptor Like Protein 54)%3B kinase/ protein binding ;gene_id=Bra032485;logic_name=glean;version=1"

我试过这个但是没有用

sub("([A-Za-z1-9]+)+[[:space:]]","\\1",t)

我想要的输出是

ID=gene:Bra032485;biotype=protein_coding;description=AT5G40170

1 个答案:

答案 0 :(得分:0)

> strsplit(t, " ")[[1]][1]
[1] "ID=gene:Bra032485;biotype=protein_coding;description=AT5G40170"