提取字符串的一部分

时间:2016-07-01 12:01:16

标签: regex r

我的表达式为FR97_6393_COROG436790。我需要在第二个下划线后删除所有内容,以便它是FR97_6393

我尝试为此创建gsub模式("FR([0-9]+)_([0-9]+).*"),但失败了。

你能帮我找出正确的模式吗?

2 个答案:

答案 0 :(得分:2)

我会使用sub,

sub("_[^_]*$", "", x)

这将删除最后一个下划线部分。

答案 1 :(得分:2)

我们可以尝试sub

sub("^([^_]+_[^_]+).*", "\\1", str1)
#[1] "FR97_6393"

数据

str1 <- "FR97_6393_COROG436790"