Ruby gsub替换中的行为不一致?

时间:2014-07-10 00:32:25

标签: ruby regex gsub

两个gsub产生不同的结果。任何人都可以解释原因吗?

代码也可在https://gist.github.com/franklsf95/6c0f8938f28706b5644d获得。

    ver = 9999
    str = "\t<key>CFBundleDevelopmentRegion</key>\n\t<string>en</string>\n\t<key>CFBundleVersion</key>\n\t<string>0.1.190</string>\n\t<key>AppID</key>\n\t<string>000000000000000</string>"
    puts str.gsub /(CFBundleVersion<\/key>\n\t.*\.).*(<\/string>)/, "#{$1}#{ver}#{$2}"
    puts '--------'
    puts str.gsub /(CFBundleVersion<\/key>\n\t.*\.).*(<\/string>)/, "#{$1}#{ver}#{$2}"

我的红宝石版本是ruby 2.1.2p95 (2014-05-08 revision 45877) [x86_64-darwin13.0](MRI)。在我的机器上,结果是:

<key>CFBundleDevelopmentRegion</key>
<string>en</string>
<key>9999
<key>AppID</key>
<string>000000000000000</string>
--------
<key>CFBundleDevelopmentRegion</key>
<string>en</string>
<key>CFBundleVersion</key>
<string>0.1.9999</string>
<key>AppID</key>
<string>000000000000000</string>

第二个是期望的效果,但第一个是错误的。

2 个答案:

答案 0 :(得分:8)

它与时间和红宝石正则表达式的工作方式有关。

gsub设置$1$2,但直到完成后才设置gsub\1。因此,当您第一次运行时,它们是空白的。第二次运行时,它们是由前一个\2设置的。如果您想要进行正则表达式捕获,则需要puts str.gsub /(CFBundleVersion<\/key>\n\t.*\.).*(<\/string>)/, '\1' + ver.to_s + '\2' 和{{1}},如下所示:

{{1}}

答案 1 :(得分:1)

如果你使用gsub()的块形式,你的代码将正常工作:

ver = 9999

str = "\t<key>CFBundleDevelopmentRegion</key>\n\t<string>en</string>\n\t<key>CFBundleVersion</key>\n\t<string>0.1.190</string>\n\t<key>AppID</key>\n\t<string>000000000000000</string>"

puts str.gsub(/(CFBundleVersion<\/key>\n\t.*\.).*(<\/string>)/) {|match|
  "#{$1}#{ver}#{$2}"
}

puts '-' * 20

puts str.gsub(/(CFBundleVersion<\/key>\n\t.*\.).*(<\/string>)/) {|match|
  "#{$1}#{ver}#{$2}"
}

--output:--
    <key>CFBundleDevelopmentRegion</key>
    <string>en</string>
    <key>CFBundleVersion</key>
    <string>0.1.9999</string>
    <key>AppID</key>
    <string>000000000000000</string>
--------------------
    <key>CFBundleDevelopmentRegion</key>
    <string>en</string>
    <key>CFBundleVersion</key>
    <string>0.1.9999</string>
    <key>AppID</key>
    <string>000000000000000</string>

文档描述了这种行为:

  

如果替换是String,   ...   但是,在更换特殊匹配变量时,例如$&amp;,   不会参考当前的比赛。

     

...

     

在块形式中,当前匹配字符串作为a传入   参数和变量,如$ 1,$ 2,$`,$&amp;和$&#39;将被设定   适当。该块返回的值将被替换   每次通话都是匹配。