如何利用正则表达式编号组

时间:2012-09-26 20:18:58

标签: c# regex

假设我有一个正则表达式模式,我想用其他东西替换模式的匹配。在当前模式中,有两组将匹配,每一组都有编号($ 1和$ 2):

Regex pattern = new Regex(@"\[([a-zA-Z0-9_\-]+)\^=([^\]]+)\]");
string replacement = "[starts-with(@$1,$2)]";

示例CSS选择器:

[id^="blah"]

预期产出:

[start-swith(@ID,"blah")] // Note ID is capitalized

这是另一种正则表达式模式:

Regex pattern = new Regex(@"\[([a-zA-Z0-9_\-]+)\*=([^\]]+)\]");
string replacement = "[contains(@$1,$2)]");

当我执行替换时,有没有办法大写$ 1组中的匹配?

注意:我有许多模式被添加到列表中并且它们与替换字符串配对,因此我必须使解决方案适用于需要对某些匹配组进行大写的所有替换。

更新

我想我只想到了一个可能的解决方案:将替换字符串转换为MatchEvaluator并在需要时返回大写的组匹配。我认为这可能有用:

Regex pattern = new Regex(@"\[([a-zA-Z0-9_\-]+)\^=([^\]]+)\]");
MatchEvaluator evaluator = new MatchEvaluator((Match m) =>
    {
        return string.Format("[starts-with(@{0},{1})]", m.Groups[1].Value.ToUpper(), m.Groups[2].Value);
    });

如果有人能想出更好的解决方案,请告诉我。非常感谢!

1 个答案:

答案 0 :(得分:1)

MatchEvaluator很好,认为你烧了我;)无论如何:

var pattern = @"([a-z]+) ([a-z]+)";
var format = "[starts-with({0}{1}]";

var input = "bla bla";
var result = ReplacePattern(input, pattern, format);

public static string ReplacePattern(string input, string pattern, string format)
{
   if (Regex.Match(input, pattern).Groups.Count != 3) return input;//or throw, or...
   return Regex.Replace(input, pattern, x =>
            string.Format(format,
                          x.Groups[1].Value.ToUpper(), 
                          x.Groups[2].Value));
}