如何在R中提取子字符串?

时间:2016-11-11 17:24:39

标签: r regex

我有这个字符串,例如:

"host": "",
"schemes": [ "http" ],

我想提取这个子字符串,例如:

str1 = "UNCID_999277.TCGA-CV-7254-01A-11R-2016-07.111118_UNC11-SN627_0167_AD09WDACXX_TAGCTT.txt"

我尝试了一些链接:

TCGA-CV-7254

但它返回:

gsub(pattern = "(*.)(TCGA*)(.*)",
   replacement = "\\2",
   x = nameArq)

感谢您的帮助!

1 个答案:

答案 0 :(得分:1)

你几乎拥有它。在第一个括号中,期间需要先到(这意味着“重复任何次数的任何字符”)。您还需要一些唯一的端点用于正则表达式的第二部分。

gsub(pattern = "(.*)(TCGA.*4)(.*)", 
     replacement = "\\2", 
     x = str1)