Question

我想从模式中第二次出现得分_后提取数字。

按照这里的类似帖子

我试过

    library(stringr)

  pattern <- c("1/2/3_500k/855kk_1400k/AVBB")

  str_extract(pattern, "(^_){2}(\\d+\\.*\\d*)")

输出

[1] NA

而不是1400。你能帮忙吗？

Answer 1

您可以使用regexpr / regmatches：

的基础R解决方案

regmatches(x, regexpr("^(?:[^_]*_){2}[^_0-9]*\\K\\d*\\.?\\d+", x, perl=TRUE))

或者sub：

sub("^(?:[^_]*_){2}[^_0-9]*(\\d*\\.?\\d+).*", "\\1", x)

正则表达式是

^(?:[^_]*_){2}[^_0-9]*\K\d*\.?\d+

<强>详情

在sub正则表达式变体中，\K不是必需的，数字模式被捕获到捕获组中，其余字符串与.*模式匹配。结果是第1组的内容，用\1占位符引用。

Answer 2

一个选项可能是：

pattern <- c("1/2/3_500k/855kk_1400k/AVBB")
sub(".*_*_(\\d+).*","\\1", pattern, perl = TRUE)
[1] "1400"

regex是：

".*_*_(\\d+).*"

<强>详细信息：

.*_

_

.*_

_

\\1将匹配的字符串替换为第一组的值。