如何获得字符串的所有可能的重叠匹配

时间:2013-08-03 05:08:10

标签: javascript regex

我正在研究“Gödel,Escher,Bach”第2章中的MIU系统问题。

其中一条规则

Rule III: If III occurs in one of the strings in your collection, you may make a new string with U in place of III.

这意味着字符串MIII可以变为MU,但对于其他更长的字符串,可能存在多种可能性[括号中的匹配]:

  • MIIII可以屈服
    • M[III]I>> MUI
    • MI[III]>> MIU
  • MUIIIUIIIU可以屈服
    • MU[III]UIIIU>> MUUUIIIU
    • MUIIIU[III]U>> MUIIIUUU
  • MUIIIIU可以屈服
    • MU[III]IU>> MUUIU
    • MUI[III]U>> MUIUU

显然,/(.*)III(.*)/这样的正则表达式很有用,但我似乎无法让它们生成所有可能的匹配,只是它碰巧找到的第一个匹配。

有没有办法产生所有可能的匹配?

(注意,我可以想办法完全手动完成这个,但我希望有更好的方法使用内置工具,正则表达式或其他方式)

(编辑以澄清重叠的需求。)

2 个答案:

答案 0 :(得分:11)

以下是您需要的正则表达式:/III/g - 简单,对吧?现在这是你如何使用它:

var text = "MUIIIUIIIU", find = "III", replace "U",
    regex = new RegExp(find,"g"), matches = [], match;
while(match = regex.exec(text)) {
    matches.push(match);
    regex.lastIndex = match.index+1;
}

regex.lastIndex...行会覆盖通常的正则表达式行为,即不匹配超出结果的结果。此外,我正在使用RegExp构造函数来使其更灵活。你甚至可以用这种方式将它构建成一个函数。

现在你有一个匹配对象数组,你可以这样做:

matches.forEach(function(m) { // older browsers need a shim or old-fashioned for loop
    console.log(text.substr(0,m.index)+replace+text.substr(m.index+find.length));
});

编辑: Here是一个JSFiddle,演示了上述代码。

答案 1 :(得分:2)

有时候正则表达式有点矫枉过正。在你的情况下,一个简单的indexOf也可能没问题!

不可否认,这是一个黑客攻击,但您可以自己将其转换为漂亮,可重复使用的代码:

var s = "MIIIIIUIUIIIUUIIUIIIIIU";
var results = [];
for (var i = 0; true; i += 1) {
    i = s.indexOf("III", i);
    if (i === -1) {
        break;
    }
    results.push(i);
}
console.log("Match positions: " + JSON.stringify(results));

它可以很好地处理重叠,至少对我来说,indexOf看起来更简单。