我编写了一个函数来转换表示数字的字符串(加载在我的系统中的 magrittr):
adjust_perc_format <- function(x, n=3){
gsub(",", ".", x, perl = T) %>% as.numeric() %>% format(nsmall=n, decimal.mark = ",")
}
所以:
adjust_perc_format("2,5", 3)
[1] "2,500"
目标是转换字符串中正则表达式定义的出现次数(参见here)。为此,我尝试了 gsubfn:
str <- "20MG/ML (2,5%)+0,5%"
gsubfn("[\\d,]+(?=%)", function(x) adjust_perc_format(x, n=3),str)
预期结果是 "20MG/ML (2,500%)+0,500%"
。相反,我得到了相同的输入字符串 ("20MG/ML (2,5%)+0,5%"
)。
我也试过如下设置引擎,没有成功:
options(gsubfn.engine = "R")
我在这里错过了什么?谢谢。
答案 0 :(得分:1)
您需要通过传递 gsubfn
参数来告诉 backref=0
使用整个匹配项:
gsubfn("[\\d,]+(?=%)", function(x) adjust_perc_format(x, n=3),str, backref=0)
R 测试:
> library(gsubfn)
> str <- "20MG/ML (2,5%)+0,5%"
> gsubfn("[\\d,]+(?=%)", function(x) adjust_perc_format(x, n=3),str, backref=0)
[1] "20MG/ML (2,500%)+0,500%"
如果你想让你的模式更可靠,你可以使用
gsubfn("\\d+(?:,\\d+)*(?=%)", function(x) adjust_perc_format(x, n=3),str, backref=0)
将匹配一个或多个数字,后跟零个或多个逗号和一个或多个数字(后跟 %
,因为它在正向前瞻中不被消耗)。