假设我有一个像这样的数据框:
library(tidyverse)
index <- 1:1000
df1 <- data.frame(index = glue::glue('index[{index}]'),
X = rnorm(1000))
我想索引mutate
,所以它是一个数字变量,括号内为数字。我可以使用以下代码做到这一点:
df2 <- df1 %>% mutate(index = gsub(pattern = 'index[', replacement = '', x = index, fixed = T),
index = gsub(pattern = ']', replacement = '', x = index, fixed = T),
index = as.numeric(index))
我确信使用正则表达式有更好的方法。理想情况下,我想要与[
之前的文本无关的内容。
答案 0 :(得分:1)
> df2 <- df1 %>% mutate(index = as.numeric(gsub("index\\[(\\d+)\\]", "\\1", index)))
> df2 %>% head
index X
1 1 1.1991921
2 2 0.5474659
3 3 -0.8437927
4 4 -1.8488537
5 5 -0.4673391
6 6 -1.1255241