从R中的字符串中间提取特定字符

时间:2017-07-12 09:15:01

标签: r gsub

我有类似的东西

st1 <- "psi-mi:pcgf1_human(display_long)|uniprotkb:RING finger protein 68(gene name synonym)|uniprotkb:Nervous system Polycomb-1(gene name synonym)|uniprotkb:PCGF1(gene name)|psi-mi:PCGF1(display_short)|uniprotkb:NSPC1(gene name synonym)|uniprotkb:RNF68(gene name synonym)"

我的预期输出

"PCGF1"

我希望在(基因名称)之前出现字符PCGF1

1 个答案:

答案 0 :(得分:4)

我们可以尝试使用sub()

name <- sub(".*:([^:]*?)\\(gene name\\).*", "\\1", st1)

在这里演示:

Rextester