QRegExp只解析以特定字符开头的字符串

时间:2015-11-16 01:15:18

标签: c++ regex qt qregexp

我正在尝试使用regexp解析这些字符串,但我认为我的正则表达式语句不正确。

我得到一个字符串,每当它有换行符和回车符时,它们必须用两个字符串分隔。字符串具有以下格式

[CharSize][Inverted][Aligned]Data

例如,如果给我这样的数据

QString s1 = "[6][1][0]Data1\n\r[5][0][1]Data2";

当我将它们分开时,会有两个QString,我将把数据放在开括号和闭括号中。

另一个有效数据是这样的:

QString s2 = "[7][0][1]Data3"

无效数据如下:

QString s3 = "abc[8][1][1]Data4"

我在下面应用了以下QRegExp:

QRegExp clrf("\n\r|\r\n|\n");
QStringList sp = str.split(clrf);

QRegexp clrf适用于使用换行和回车分隔数据,反向或仅换行。注意:s1,s2和s3在这里处理得很好。

问题在于:

QRegExp value("[^a-z]?\\[([0-9a-z]+)\\]\\[([0-9a-z]+)\\]\\[([0-9a-z]+)\\]([A-Za-z0-9\\'\\ \"]*)");

当我使用上面的代码时,s1,s2和s3都被处理了。 S3 不应该处理,因为它的第一个字符不是开括号。你能帮我纠正我的QRegExp吗?

谢谢。

编辑: 整个代码:

void parseString(QString str)
{

    QRegExp clrf("\n\r|\r\n|\n");
    QRegExp value("\\[([0-9a-z]+)\\]\\[([0-9a-z]+)\\]\\[([0-9a-z]+)\\]([A-Za-z0-9\\'\\ \"]*)");
//     QRegExp value("^\[(\\d+)\]\[(\\d+)\]\[(\\d+)\](.*)$");

    int p = 0, i = 0;
    int res;
    int cs = 0, inv = 0, al = 0;

    QStringList sp = str.split(clrf);

    XLineString ls;

    for (i = 0; i < sp.size(); ++i) {
        res = value.indexIn(sp[i], p);
        while (res != -1) {
            printf("Text=[%s]\n", value.cap(EData).toStdString().c_str());

            printf("Digit cs[%d] ", value.cap(ECharSize).toInt());
            printf("inv[%d] ", value.cap(EInvert).toInt());
            printf("al[%d]\n", value.cap(EAlignment).toInt());

            cs = value.cap(ECharSize).toInt();
            if (value.cap(EInvert).toInt())
                inv = 1;
            else
                inv = 0;

            if (value.cap(EAlignment).toInt())
                al = 1;
            else
                al = 0;
            ls.addLine(value.cap(EData).toStdString().c_str(), cs, inv, al);
            p += value.matchedLength();
            res = value.indexIn(str, p);
        }
    }    
}

int main()
{   
    QString str1[] = { 
        "[12][0][0]DATA1\n\r[78][0][1]DATA2",
        "abc[1][1][1]THIS SHOULD NOT PASS",
    };

    for (int i = 0; i < sizeof(str1) / sizeof(str1[0]); ++i)
        parseString(str1[i]);
}

1 个答案:

答案 0 :(得分:1)

为了回答您的问题,我已经使用PyQt5(为简单起见)对此进行了测试

import re
R = ["\\[([0-9a-z]+)\\]\\[([0-9a-z]+)\\]\\[([0-9a-z]+)\\]([A-Za-z0-9\\'\\ \"]*)", "^\[(\\d+)\]\[(\\d+)\]\[(\\d+)\](.*)$"]
tests = ["[6][1][0]Data1\n\r[5][0][1]Data2", "[7][0][1]Data3", "abc[8][1][1]Data4"]
s = re.compile("\n\r|\r\n|\n") # emulate QRegExp split feature
for r in R:
    r=QRegExp(r)
    for T in tests:
        for t in s.split(T):
            print(r.indexIn(t))

结果:

0
0
0
3
0
0
0
-1

结论:如果你只是测试那个&#34; indexIn&#34;你的原始匹配也可以工作。等于0而不是等于-1,而我的修改版本应该以任何一种方式工作。

我认为你最好的选择就是修改你的代码,确保索引等于0.我可能还建议你使用If语句而不是While语句,或者你可以重复匹配同一行。