正则表达式w /平衡组不仅匹配最外面的匹配

时间:2013-04-01 22:08:15

标签: c# .net regex

我已经阅读了有关如何使用平衡组的多个来源,但所有示例仅匹配最外面的匹配。是否可以将匹配模式的所有子串与一个RegEx匹配? (平台是.NET 4.0)

这是我想要的一个例子: 输入:

  

a +((b +(c + d))+(e + f))

所需的匹配('教科书'RegEx仅生成第一个匹配项):

  
      
  • ((b +(c + d))+(e + f))
  •   
  • (b +(c + d))
  •   
  • (c + d)
  •   
  • (e + f)
  •   

2 个答案:

答案 0 :(得分:2)

这可以通过前瞻的帮助在正则表达式中完成。但这并不是最佳的,因为它会为每场比赛“重新分析”一些括号组。使用真正的解析器只会读取/解析字符串一次,效率会更高。

示例(ideone):

using System;
using System.Text.RegularExpressions;

public class Example
{
   public static void Main()
   {
      var re = @"(?x)  # ignore spaces and comments
(?=                    # lookahead (zero width)
  (
    \(                 # first (
    (?:
      (?<open> \( )*   # open++
      [^()]+
      (?<-open> \) )*  # open--
    )+
    \)                 # last )
    (?(open)(?!))      # fail if unblanaced: open > 0
  )
)
\(                     # eat a (, to advance the match a char";

      var str = "a + ((b + (c + d)) + (e + f)) + (x + ((y) + (z)) + x)";

      var m = Regex.Matches(str, re);

      Console.WriteLine("Matched: ");
      foreach (Match i in m)
        Console.WriteLine(i.Groups[1]);
   }
}

输出:

Matched: 
((b + (c + d)) + (e + f))
(b + (c + d))
(c + d)
(e + f)
(x + ((y) + (z)) + x)
((y) + (z))
(y)
(z)

答案 1 :(得分:0)

如果您使用的是javascript,那么下面是一个可以使用上述输入的示例

var rgx = /\([a-z]+\s*\+\s*(\([a-z]+\s*\+\s*[a-z]+\s*\))\s*\)/g;
var str = 'a + (b + (c + d))';  
console.log(rgx.exec(str));

它不适用于像这样的更多变量,因为它只是一个简单的测试用例

a + (d + (c + e) + x)