Question

我有一个像

这样的字符串

XXX1234的属性ISC_FLOW：ENTITY是FLOW_VERIFY（IDCODE）＆amp; INITIALIZE＆amp; （IDCODE WAIT TCK 1 32：01805043 * 0FFFFFFF），＆amp; FLOW_ENABLE＆amp; INITIALIZE＆amp; （ISC_ENABLE WAIT TCK 3,20.0E-3），＆amp; FLOW_ERASE＆amp;

INITIALIZE＆amp; （ISC_ERASE WAIT TCK 3,200.0E-3）＆amp; （ISC_DISCHARGE WAIT TCK 3,200.0E-3），＆amp; FLOW_PRELOAD＆amp; INITIALIZE＆amp; （样品68：0等待TCK 1），＆amp;
  FLOW_PROGRAM（ARRAY）＆amp; INITIALIZE＆amp; （ISC_ADDRESS_INIT WAIT TCK 1）＆amp; REPEAT 100＆amp; （ISC_PROGRAM 172：？WAIT TCK 3,13.0E-3），＆amp; FLOW_VERIFY（ARRAY）＆amp; INITIALIZE＆amp; （ISC_ADDRESS_SHIFT 100：

$ ADDR = 800000000000000000000000＆安培; 0＆amp;等待TCK 1）＆amp; REPEAT 100＆amp; （ISC_READ WAIT TCK 1,1.0E-3 172：？：CRC）＆amp; （ISC_ADDRESS_SHIFT 100：$ ADDR＆gt;＆gt; 1等待TCK 1）

我需要编写一个应该单独分割每个FLOW的模式。

这样结果就像

1. FLOW_VERIFY(IDCODE)                  INITIALIZE        (IDCODE        WAIT TCK 1 32:01805043*0FFFFFFF)
2. FLOW_ENABLE                          INITIALIZE        (ISC_ENABLE    WAIT TCK 3, 20.0E-3)
3. FLOW_ERASE                           INITIALIZE        (ISC_ERASE     WAIT TCK 3, 200.0E-3)        (ISC_DISCHARGE WAIT TCK 3, 200.0E-3)
4. FLOW_PRELOAD                         INITIALIZE        (SAMPLE 68:0 WAIT TCK 1)
5. FLOW_PROGRAM(ARRAY)                  INITIALIZE        (ISC_ADDRESS_INIT         WAIT TCK 1)    REPEAT 100       (ISC_PROGRAM 172:? WAIT TCK 3, 13.0E-3)
6. FLOW_VERIFY(ARRAY)                   INITIALIZE        (ISC_ADDRESS_SHIFT 100:$ADDR=800000000000000000000000        0         WAIT TCK 1)      REPEAT 100  (ISC_READ  WAIT TCK 1, 1.0E-3 172:?:CRC) (ISC_ADDRESS_SHIFT 100:$ADDR>>1 WAIT TCK 1)

我尝试了很多模式，但我无法正确解析它。

这是我最终尝试过的模式。

"(?<Func>[a-z0-9\\(\\)_]*)[\r\t\n ]*&[\r\t\n ]*(?<Instr>(INITIALIZE|REPEAT|TERMINATE))[\r\t\n ]*[0-9]*&(?<Action>[0-9a-z \r\t\n:*,\\(\\).\\-_\\?!$=]*)"

请帮我写一个模式，从上面的字符串中分隔每个FLOW值。

Answer 1

由于您的所有字段都被&很好地隔开，我建议

split the string在&上，它为您提供了一个数组，
使用一些if语句迭代数组。

我认为这个解决方案比大型正则表达式更具可读性（因此更易于维护）。

Answer 2

我试图想出一个正则表达式而我不能。我认为使用纯字符串搜索会更简单。沿着以下几点：

string flows = "<your example>";
int index = -1;
List<string> flowStrings = new List<string>();
const string flowStr = "FLOW_";
index = flows.IndexOf(flowStr);
int nextIndex = flows.IndexOf(flowStr, index + 1);
while(index != -1 && nextIndex != -1)
{
    string currentFlow = flows.Substring(index, nextIndex - index);
    index = nextIndex;
    nextIndex = flows.IndexOf(flowStr, index + 1);
}

当然，我没有很多使用正则表达式的经验。

Answer 3

试试这个：

(?<Func>FLOW_(?:[A-Z]+)(?:\([A-Z]+\))?)\s+&\s+(?<Inst>[A-Z]+)\s+&\s(?<Action>(?:(?:(?:\([^)]+\))|[A-Z0-9\s]+)(?:\s?&\s)?)+)

Answer 4

由于我认为此问题与您的其他问题（How to split a string in C#）有关，我相信这可能会对您有所帮助。

您可以使用solution provided there将输入数据拆分为多个字符串（作为起点，在进一步解析之前）。

因此，如果您像这样定义Split方法：

private static List<string> Split(string input, IEnumerable<string> delimiters)
{
    List<string> results = new List<string>();
    List<int> indices = new List<int>();

    // get indices of delimiters
    foreach (string s in delimiters)
    {
        int idx = input.IndexOf(s);
        if (idx >= 0)
            indices.Add(idx);
    }
    indices.Sort();
    if (indices.Count > 0)
    {
        indices.Add(input.Length);
        // split the string
        for (int i = 0; i < indices.Count - 1; i++)
        {
            int idx = indices[i], nextIdx = indices[i + 1];
            results.Add(input.Substring(idx, nextIdx - idx).Trim());
        }
    }
    return results;
}

然后这会将它拆分为所有定义的“FLOW”分隔符：

string data = "ATTRIBUTE ISC_FLOW ...

string[] delimiters = new string[]
{
    "FLOW_VERIFY",
    "FLOW_ENABLE",
    "FLOW_ERASE",
    "FLOW_PRELOAD",
    "FLOW_PROGRAM"
};

List<string> results = Split(data, delimiters);
for (int i = 0; i < results.Count; i++)
{
    Console.WriteLine("{0}. {1}", i + 1, results[i]);
    Console.WriteLine();
}

Console.Read();

最后，您可以将每个结果分成&个字符来获取单个代币：

foreach (string item in results)
{
    List<string> tokens = new List<string>();

    // split at &
    foreach (string t in item.Split('&'))
    {
        // trim spaces
        string token = t.Trim();

        // ignore empty tokens
        if (token == "")
            continue;

        tokens.Add(t);
    }

    // print tokens, separated by tabs
    foreach (string t in tokens)
        Console.Write("{0}\t", t);

    Console.WriteLine();
    Console.WriteLine();
}

正则表达式拆分字符串

4 个答案: