使用正则表达式提取括号内的数字?

时间:2018-08-21 16:22:51

标签: r regex string dplyr gsub

假设我有一个像这样的数据框:

library(tidyverse)
index <- 1:1000
df1 <- data.frame(index = glue::glue('index[{index}]'),
                  X = rnorm(1000))

我想索引mutate,所以它是一个数字变量,括号内为数字。我可以使用以下代码做到这一点:

df2 <- df1 %>% mutate(index = gsub(pattern = 'index[', replacement = '', x = index, fixed = T),
                      index = gsub(pattern = ']', replacement = '', x = index, fixed = T),
                      index = as.numeric(index))

我确信使用正则表达式有更好的方法。理想情况下,我想要与[之前的文本无关的内容。

1 个答案:

答案 0 :(得分:1)

> df2 <- df1 %>% mutate(index = as.numeric(gsub("index\\[(\\d+)\\]", "\\1", index)))
> df2 %>% head
  index          X
1     1  1.1991921
2     2  0.5474659
3     3 -0.8437927
4     4 -1.8488537
5     5 -0.4673391
6     6 -1.1255241