C#正则表达式麻烦

时间:2012-01-18 00:45:52

标签: c# regex filehelpers

问题!

我从平面文件中获得以下输入(规则)(谈论数字输入):

  • 输入可能是自然数(低于1000):1, 10, 100, 999, ...
  • 输入可能是以引号括起的逗号分隔数字(1000以上):"1,000", "2,000", "3,000", "10,000", ...

我有以下正则表达式来验证输入:(?:(\d+)|\x22([0-9]+(?:,[0-9]+)*)\x22),所以对于像10这样的输入我期待第一个匹配组10,这正是我的意思拿到。但是当我得到"10,000"之类的输入时,我期待第一个匹配组10,000,但它存储在第二个匹配组中。

实施例

string text1 = "\"" + "10,000" + "\"";
string text2 = "50";

string pattern = @"(\d+)|\x22([0-9]+(?:,[0-9]+){0,})\x22";

Match match1 = Regex.Match(text1, pattern);
Match match2 = Regex.Match(text2, pattern);

if (match1.Success)
{
    Console.WriteLine("Match#1 Group#1: " + match1.Groups[1].Value);
    Console.WriteLine("Match#1 Group#2: " + match1.Groups[2].Value);

    # Outputs
    # Match#1 Group#1: 
    # Match#1 Group#2: 10,000
}

if (match2.Success)
{
    Console.WriteLine("Match#2 Group#1: " + match2.Groups[1].Value);
    Console.WriteLine("Match#2 Group#2: " + match2.Groups[2].Value);

    # Outputs
    # Match#2 Group#1: 50
    # Match#2 Group#2: 
}

预期结果

两个结果都在同一个匹配组中,在本例中为1

问题?

  • 我做错了什么?我只是从正则表达式匹配中得到了错误的分组。
  • 另外,我正在使用filehelpers .NET来解析文件,有没有其他方法可以解决这个问题。 Actualy我正在尝试实现自定义转换器。

目标文件

[FieldConverter(typeof(OOR_Quantity))]
public Int32 Quantity;

OOR_Quantity

internal class OOR_Quantity : ConverterBase
{
    public override object StringToField(string from)
    {
        string pattern = @"(?:(\d+)|\x22([0-9]+(?:,[0-9]+)*)\x22)";
        Regex regex = new Regex(pattern);

        if (regex.IsMatch(from))
        {
            Match match = regex.Match(from);
            return int.Parse(match.Groups[1].Value);
        }

        throw new ...
    }
}

2 个答案:

答案 0 :(得分:5)

组编号完全基于它们在正则表达式中的位置来分配 - 具体来说,是开括号(的相对位置。在正则表达式中,(\d+)是第一个组,([0-9]+(?:,[0-9]+)*)是第二个组。

如果您想使用相同的标识符引用它们,请使用命名组并为它们指定相同的名称:

@"(?:(?<NUMBER>\d+)|\x22(?<NUMBER>[0-9]+(?:,[0-9]+)*)\x22)"

现在,您可以将捕获的值检索为match.Groups["NUMBER"].Value

答案 1 :(得分:0)

我用Ruby测试了下面的正则表达式:

text1 = "\"10,000\""
text2 = "50"

regex = /"?([0-9]+(?:,[0-9]+){0,})"?/

text1 =~ regex
puts "#$1"

text2 =~ regex
puts "#$1"

结果是:

10,000
50

我认为你可以用C#重写。对你来说还不够吗?