我正在尝试隔离R中字符串的一部分。字符串的格式为ABC_constantStuff_ABC_randomStuff
,而ABC
就是我要提取的内容。 ABC
未知,可能长达1-3个字符。我一直在尝试grep
和gsub
,但我不确定如何使用
str <- 'GDP\" title=\"GDP - News\"></a>"'
symbol <- gsub(pattern,'',str)
此处GDP
未知且可以是1-3个字符,\" title=\"
在每个字符串中都是常量,我想删除\" title=\"GDP - News\"></a>"
提前感谢您的帮助。
答案 0 :(得分:4)
一个简单的是
R> gsub("^([A-Z]*)_.*", "\\1", "ABC_constantStuff_ABC_randomStuff")
[1] "ABC"
R>
获取所有字母到第一个_
。
另一个假设_
是你的分隔符是
R> strsplit( "ABC_constantStuff_ABC_randomStuff", "_")[[1]][c(1,3)]
[1] "ABC" "ABC"
R>
答案 1 :(得分:3)
这有帮助吗?
> sub("\".*$", "", str)