用于查找特定正则表达式匹配的字符串的算法

时间:2010-11-28 19:20:36

标签: c# regex

鉴于正则表达式模式,我正在尝试找到与之匹配的字符串。类似于Django如何反转它们,但在C#中。是否有任何预先制作的C#库可以做到这一点?


修改:很快就将此项目移至Google code

当前测试结果

^abc$                     > abc                  : pass
\Aa                       > a                    : pass
z\Z                       > z                    : pass
z\z                       > z                    : pass
z\z                       > z                    : pass
\G\(a\)                   > \(a\)                : pass
ab\b                      > ab                   : pass
a\Bb                      > ab                   : pass
\a                        >                     : pass
[\b]                      >                    : pass
\t                        > \t                   : pass
\r                        > \r                   : pass
\v                        > ♂                    : pass
\f                        > \f                   : pass
\n                        > \n                   : pass
\e                        > ←                    : pass
\141                      > a                    : pass
\x61                      > a                    : pass
\cC                       > ♥                    : pass
\u0061                    > a                    : pass
\\                        > \\                   : pass
[abc]                     > a                    : pass
[^abc]                    > î                    : pass
[a-z]                     > a                    : pass
.                         > p                    : pass
\w                        > W                    : pass
\W                        > ☻                    : pass
\s                        > \n                   : pass
\S                        > b                    : pass
\d                        > 4                    : pass
\D                        > G                    : pass
(a)\1                     > aa                   : pass
(?<n>a)\k<n>              > aa                   : pass
(?<n>a)\1                 > aa                   : pass
(a)(?<n>b)\1\2            > abab                 : pass
(?<n>a)(b)\1\2            > abba                 : pass
(a(b))\1\2                > ababb                : pass
(a(b)(c(d)))\1\2\3\4      > abcdabcdbcdd         : pass
a\0                       > a                    : pass
ab*                       > a                    : pass
ab+                       > abbb                 : pass
ab?                       > a                    : pass
ab{2}                     > abb                  : pass
ab{2,}                    > abbbbbbbbb           : pass
ab{2,3}                   > abb                  : pass
ab*?                      > abb                  : pass
ab+?                      > abbbbb               : pass
ab??                      > a                    : pass
ab{2}?                    > abb                  : pass
ab{2,}?                   > abbbbbbbbb           : pass
ab{2,3}?                  > abbb                 : pass
/users(?:/(?<id>\d+))?    > /users/77            : pass
Passed 52/52 tests.

2 个答案:

答案 0 :(得分:4)

请参阅示例Using Regex to generate Strings rather than match them

您也可以查看http://en.wikipedia.org/wiki/Deterministic_finite-state_machine,尤其是“接受和生成模式”部分。

正如其他人所说,您需要从正则表达式创建DFA,然后使用此DFA生成字符串。

将正则表达式转换为DFA,首先生成NFA(例如参见http://lambda.uta.edu/cse5317/spring01/notes/node9.html),然后将NFA转换为DFA。

我看到的最简单的方法是使用解析器生成器程序。我不认为django这样做。

希望这会有所帮助。

答案 1 :(得分:2)

“是否有任何预先制作的C#库可以执行此操作?”

(我希望这可以作为答案暂时接受)