在R中修剪一个字符串

时间:2013-02-08 14:56:06

标签: regex string r gsub

我正在尝试隔离R中字符串的一部分。字符串的格式为ABC_constantStuff_ABC_randomStuff,而ABC就是我要提取的内容。 ABC未知,可能长达1-3个字符。我一直在尝试grepgsub,但我不确定如何使用

指定正则表达式
str <- 'GDP\" title=\"GDP - News\"></a>"'
symbol <- gsub(pattern,'',str)

此处GDP未知且可以是1-3个字符,\" title=\"在每个字符串中都是常量,我想删除\" title=\"GDP - News\"></a>"

提前感谢您的帮助。

2 个答案:

答案 0 :(得分:4)

一个简单的是

R> gsub("^([A-Z]*)_.*", "\\1", "ABC_constantStuff_ABC_randomStuff")
[1] "ABC"
R> 

获取所有字母到第一个_

另一个假设_是你的分隔符是

R> strsplit( "ABC_constantStuff_ABC_randomStuff", "_")[[1]][c(1,3)]
[1] "ABC" "ABC"
R> 

答案 1 :(得分:3)

这有帮助吗?

> sub("\".*$", "", str)