.net Regex.Split

时间:2012-04-21 00:58:16

标签: c# .net regex

我正在尝试将以下字符串"Name=='mynme' && CurrentTime<'2012-04-20 19:45:45'"拆分为:

Name
==
'myname'
&&
CurrentTime
<
'2012-04-20 19:45:45'

我有以下正则表达式:

([+\\-*/%()]{1}|[=<>!]{1,2}|[&|]{2})

问题是当使用上面的正则表达式时,我得到以下结果:

Name
== 
'myname'
&&
CurrentTime 
<
'2012
-
04
-
20
19:45:45'

我几乎需要正则表达式引用。

由于

有关lordcheeto答案的更新1:

您的回答很接近。但以下仍未正确分割:

 string input2 = "((1==2) && 2-1==1) || 3+1==4 && Name=='Stefan+123'";

我需要做的是将字符串拆分为运算符和操作数。像这样:

 LeftOperand Operator RightOperand

现在,如果任何运算符在''之间,则应忽略它,并且''之间的整个字符串应被视为操作数。

上面的字符串应该生成以下输出:

(

(
1
==
2
)

&&
2
-
1
==
1
)

||
3
+
1
==
4
&&
Name
==
'Stefan+123'

2 个答案:

答案 0 :(得分:3)

好的,假设您希望它简单地拆分逻辑和关系运算符,您可以使用此模式:

string lordcheeto = @"\s*(==|&&|<=|>=|<|>)\s*";    

这也将修剪返回字符串中的所有空格。

<强>代码:

using System;
using System.Text.RegularExpressions;

namespace RegEx
{
    class Program
    {
        static void Main(string[] args)
        {
            string original = "([+\\-*/%()]{1}|[=<>!]{1,2}|[&|]{2})";
            string lordcheeto = @"\s*(==|&&|<=|>=|<|>)\s*";

            string input = "Name=='mynme' && CurrentTime<45 - 4";
            string input1 = "Name=='mynme' && CurrentTime<'2012-04-20 19:45:45'";
            string ridiculous = "Name == BLAH && !@#>=$%^&*()< ASDF &&    this          >          that";

            executePattern("original", input, original);
            executePattern("lordcheeto's", input, lordcheeto);
            executePattern("original", input1, original);
            executePattern("lordcheeto's", input1, lordcheeto);
            executePattern("original", ridiculous, original);
            executePattern("lordcheeto's", ridiculous, lordcheeto);
        }

        static void executePattern(string version, string input, string pattern)
        {
            // Avoiding repitition for this example.
            Console.WriteLine("Using {0} pattern:", version);

            // Needs to be trimmed.
            var result = Regex.Split(input.Trim(), pattern);

            // Pipes included to highlight whitespace trimming.
            foreach (var m in result)
                Console.WriteLine("|{0}|", m);

            // Extra space.
            Console.WriteLine();
            Console.WriteLine();
        }
    }
}

<强>测试

http://goo.gl/XAm6J

<强>输出:

Using original pattern:
|Name|
|==|
|'mynme' |
|&&|
| CurrentTime|
|<|
|45 |
|-|
| 4|


Using lordcheeto's pattern:
|Name|
|==|
|'mynme'|
|&&|
|CurrentTime|
|<|
|45 - 4|


Using original pattern:
|Name|
|==|
|'mynme' |
|&&|
| CurrentTime|
|<|
|'2012|
|-|
|04|
|-|
|20 19:45:45'|


Using lordcheeto's pattern:
|Name|
|==|
|'mynme'|
|&&|
|CurrentTime|
|<|
|'2012-04-20 19:45:45'|


Using original pattern:
|Name |
|==|
| BLAH |
|&&|
| |
|!|
|@#|
|>=|
|$|
|%|
|^&|
|*|
||
|(|
||
|)|
||
|<|
| ASDF |
|&&|
|    this          |
|>|
|          that|


Using lordcheeto's pattern:
|Name|
|==|
|BLAH|
|&&|
|!@#|
|>=|
|$%^&*()|
|<|
|ASDF|
|&&|
|this|
|>|
|that|

修改

好的,有了额外的限制,你应该能够使用它:

string lordcheeto = @"\s*('.*?'|&&|==|<=|>=|<|>|\(|\)|\+|-|\|\|)\s*";

这仍将修剪返回字符串中的所有空格。但是,如果匹配彼此相邻(例如Name=='Stefan+123'),它将返回空字符串。这次我无法解决这个问题,但这并不重要。

如果您导入System.LinqSystem.Collections.Generic并将结果设为List<string>,则可以在此一行中删除List中的所有空字符串(这是慢于使用直接换循环):

var results = Regex.Split(input.Trim(), pattern).ToList();
results.RemoveAll(x => x == "");

<强>代码:

using System;
using System.Text.RegularExpressions;

namespace RegEx
{
    class Program
    {
        static void Main(string[] args)
        {
            string lordcheeto = @"\s*('.*?'|&&|==|<=|>=|<|>|\(|\)|\+|-|\|\|)\s*";

            string input = "Name=='mynme' && CurrentTime<45 - 4";
            string input1 = "Name=='mynme' && CurrentTime<'2012-04-20 19:45:45'";
            string input2 = "((1==2) && 2-1==1) || 3+1==4 && Name=='Stefan+123'";

            executePattern("lordcheeto's", input, lordcheeto);
            executePattern("lordcheeto's", input1, lordcheeto);
            executePattern("lordcheeto's", input2, lordcheeto);

            Console.ReadLine();
        }

        static void executePattern(string version, string input, string pattern)
        {
            // Avoiding repitition for this example.
            Console.WriteLine("Using {0} pattern:", version);

            // Needs to be trimmed.
            var result = Regex.Split(input.Trim(), pattern);

            // Pipe included to highlight empty strings.
            foreach (var m in result)
                Console.WriteLine("|{0}", m);

            // Extra space.
            Console.WriteLine();
            Console.WriteLine();
        }
    }
}

<强>测试

http://goo.gl/lkaoM

<强>输出:

Using lordcheeto's pattern:
|Name
|==
|
|'mynme'
|
|&&
|CurrentTime
|<
|45
|-
|4


Using lordcheeto's pattern:
|Name
|==
|
|'mynme'
|
|&&
|CurrentTime
|<
|
|'2012-04-20 19:45:45'
|


Using lordcheeto's pattern:
|
|(
|
|(
|1
|==
|2
|)
|
|&&
|2
|-
|1
|==
|1
|)
|
|||
|3
|+
|1
|==
|4
|&&
|Name
|==
|
|'Stefan+123'
|

其他评论:

如果你想拆分任何其他运营商(例如,<<+==-=>>)(还有{ {3}}),或者需要其他任何东西,只要问一下。

答案 1 :(得分:1)

感谢“lordcheeto”的答案,我能够解决您的解决方案中的类似问题。我正在分享我的问题和解决方案,以防万一有类似问题的人。

我必须分割字符串

"abc < 1 && 124 > 2 || 1243 <= 555";

First Into

abc < 1
&&
124 > 2
||
1243 <= 555

我通过使用

实现了这一目标
string[] condtions = Regex.Split(str, @"\s*('.*?'|&&|\|\|)\s*");

然后我必须将每个条件分开,如

abc < 1 

abc
<
1

我通过使用

实现了这一目标
string[] statements = Regex.Split(condtions[0], @"\s*('.*?'|==|<=|>=|<|>|!=)\s*");