使用 gsubfn 替换字符串中的多个实例

时间:2021-05-27 21:09:24

标签: r regex gsubfn

我编写了一个函数来转换表示数字的字符串(加载在我的系统中的 magrittr):

adjust_perc_format <- function(x, n=3){
  gsub(",", ".", x, perl = T) %>% as.numeric() %>% format(nsmall=n, decimal.mark = ",")
}

所以:

adjust_perc_format("2,5", 3) 
[1] "2,500"

目标是转换字符串中正则表达式定义的出现次数(参见here)。为此,我尝试了 gsubfn:

str <- "20MG/ML (2,5%)+0,5%"
gsubfn("[\\d,]+(?=%)", function(x) adjust_perc_format(x, n=3),str)

预期结果是 "20MG/ML (2,500%)+0,500%"。相反,我得到了相同的输入字符串 ("20MG/ML (2,5%)+0,5%")。

我也试过如下设置引擎,没有成功:

options(gsubfn.engine = "R")

我在这里错过了什么?谢谢。

1 个答案:

答案 0 :(得分:1)

您需要通过传递 gsubfn 参数来告诉 backref=0 使用整个匹配项:

gsubfn("[\\d,]+(?=%)", function(x) adjust_perc_format(x, n=3),str, backref=0)

R 测试:

> library(gsubfn)
> str <- "20MG/ML (2,5%)+0,5%"
> gsubfn("[\\d,]+(?=%)", function(x) adjust_perc_format(x, n=3),str, backref=0)
[1] "20MG/ML (2,500%)+0,500%"

如果你想让你的模式更可靠,你可以使用

gsubfn("\\d+(?:,\\d+)*(?=%)", function(x) adjust_perc_format(x, n=3),str, backref=0)

将匹配一个或多个数字,后跟零个或多个逗号和一个或多个数字(后跟 %,因为它在正向前瞻中不被消耗)。