正则表达式分裂与例外

时间:2012-12-14 14:03:29

标签: c# .net regex

这是this SO question的扩展。与原始问题相比,这个问题考虑了两个不同的封闭字符。

我想拆分任意数字的(白色)空格但忽略<>之间的所有内容和“”。所以这个字符串:

string Line = "1  2  <1  2> \"hello world\"   3";

应该导致:

1,2,&lt; 1 2&gt;,“hello world”,3

2 个答案:

答案 0 :(得分:3)

我将使用Split

而不是Matches
string Line = "1  2  <1  2> \"hello world\"   3";
var parts = Regex.Matches(Line, @"[<\""]{1}[\w \d]+?[>\""]{1}|[\w\d]+")
                 .Cast<Match>()
                 .Select(m=>m.Value)
                 .ToArray();

PS:这也匹配"abc def>。但我忽略它以使正则表达式更短

答案 1 :(得分:0)

这是我到目前为止所提出的:

public static string[] GetSplitStrings(string input)
{
    IList<string> splitStrings = new List<string>();
    var counter = 0;

    var sb = new StringBuilder();
    var inLessGreater = false; // sometimes <> can contain "
    foreach (var character in input)
    {
    if (character.Equals('<'))
    {
        inLessGreater = true;
        counter++;
    }

    if (character.Equals('>'))
    {
        inLessGreater = false;
        counter++;
    }

    if (character.Equals('"') && !inLessGreater)
    {
        counter++;
    }

    if ((character.Equals(' ') && counter == 0) || (counter == 2))
    {
        if (sb.ToString().Equals("") == false)
        {
        if (character.Equals('"') || character.Equals('>'))
        {
            sb.Append(character);
        }
        splitStrings.Add(sb.ToString());
        }
        sb.Clear();
        counter = 0;
    }
    else
    {
        sb.Append(character);
    }
    }

    return splitStrings.ToArray();
}

更喜欢整齐的正则表达式解决方案。