R qdap :: mgsub,如何传递带正则表达式的模式?

时间:2015-02-15 22:49:08

标签: r qdap

在上一个问题(replace string in R giving a vector of patterns and vector of replacements)中,y发现mgsub确实具有不需要br转义的字符串作为模式。当您想要将'[%。+%]'等文本替换为文字字符串时,这很好,但如果您需要传递一个真正的正则表达式,那么这是一件坏事:

library('stringr')
library('qdap')

tt_ori <- 'I have VAR1 and VAR2'
ttl <- list(ttregex='VAR([12])', val="val-\\1")
ttl 

# OK
stringr::str_replace_all( tt_ori, perl( ttl$ttregex), ttl$val)
# [1] "I have val-1 and val-2"

# OK
mapply(gsub, ttl$ttregex, ttl$val, tt_ori, perl=T)
# [1] "I have val-1 and val-2"

# FAIL
qdap::mgsub(ttl$ttregex, ttl$val, tt_ori)
# [1] "I have VAR1 and VAR2"

如何将正则表达式传递给mgsub?

[UPDATE] @BondeDust很严格,这个过于简单的例子这个问题没有意义。想要使用mgsub的原因在于它能够使用模式向量和用单个字符串替换的向量,并在此字符串中进行所有替换。

例如在下一个例子中

> tt_ori <- 'I have VAR1 and VAR2 at CARTESIAN'
> ttl <- list(  ttregex=c('VAR([12])', 'CARTESIAN')
+             , valregex=c("val-\\1", "XY")
+             , tt=c('VAR1', 'VAR2', 'CARTESIAN')
+             , val=c('val-1', 'val-2', 'XY')
+             )
> ttl 
$ttregex
[1] "VAR([12])" "CARTESIAN"
$valregex
[1] "val-\\1" "XY"     

$tt
[1] "VAR1"      "VAR2"      "CARTESIAN"
$val
[1] "val-1" "val-2" "XY"   

# str_replace and gsub return multiple strings with partial substitutions 
> stringr::str_replace_all( tt_ori, perl( ttl$ttregex), ttl$valregex)
[1] "I have val-1 and val-2 at CARTESIAN" "I have VAR1 and VAR2 at XY"         
> mapply(gsub, ttl$ttregex, ttl$valregex, tt_ori, perl=T)
                            VAR([12])                             CARTESIAN 
"I have val-1 and val-2 at CARTESIAN"          "I have VAR1 and VAR2 at XY" 

# qdap (passing regexes) FAIL
> qdap::mgsub(ttl$ttregex, ttl$valregex, tt_ori)
[1] "I have VAR1 and VAR2 at XY"

# qdap (passing strings) is OK
> qdap::mgsub(ttl$tt, ttl$val, tt_ori)
[1] "I have val-1 and val-2 at XY"

我想尽可能利用正则表达式而不是写出所有可能的字符串(有时候我不提前知道它们)。

1 个答案:

答案 0 :(得分:2)

fixed = TRUE更改为fixed = FALSE