如何将Backus-Naur Form表达式转换为正则表达式(.Net)?

时间:2012-05-09 06:13:59

标签: .net regex bnf

表达式是:

N | ( 1 { A | B | C | D | E1 | E2 | E3 } )

表示描述符“N”或一个或多个列出的描述符而不重复。

我得到的最好的是:

@"^(N|(A|B|C|D|E1|E2|E3){1,})$"

但这并不能阻止重复。

@"^(N|(A{0,1}B{0,1}...)$" 

这可以防止重复,但需要对元素进行特定的顺序,这也不是真的。

有什么想法吗?

(我实际上并不确定bnf表达式本身不允许重复,但这就是我需要的。)

2 个答案:

答案 0 :(得分:4)

嗯,你可以,但它不漂亮:

Regex regexObj = new Regex(
    @"^           # Start of string
    (?:           # Either match...
     N            # N
    |             # or...
     (?:          # Match one of the following:
      A(?!.*A)    # A unless followed somewhere later by another A
     |            # or
      B(?!.*B)    # B unless...
     |            # etc. etc.
      C(?!.*C)
     |
      D(?!.*D)
     |
      E1(?!.*E1)
     |
      E2(?!.*E2)
     |
      E3(?!.*E3)
     )+           # one or more times
    )             # End of alternation
    $             # End of string", 
    RegexOptions.IgnorePatternWhitespace);

此解决方案使用negative lookahead assertions

答案 1 :(得分:1)

我不确定即使对于.net Regex(这比常规语言的最严格定义更强大')也可以做到这一点;无论如何,除非你只要求使用Regex,否则(我的想法)并没有错:

bool IsValid(string input)
{
    var Ns = input.Count(c => c == 'N');
    var As = input.Count(c => c == 'A');
    // etc
    var E1s = Regex.Matches(input, "E1").Count
    // etc

    var maxDescriptorCount = (new[] { As, ... ,E1s, ... }).Max();

    var isValid = 
        ((Ns == 1) && (maxDescriptorCount == 0))
        ||
        ((Ns == 0) && (maxDescriptorCount == 1))
        ;

    return isValid;
}

它是解决问题的最短代码吗?不可以。它是否可读和可维护?我想是的。

(如果需要,您可以编写带有签名int MaxN(params int[] numbers)的实用工具方法)