我正在尝试使用regexp解析这些字符串,但我认为我的正则表达式语句不正确。
我得到一个字符串,每当它有换行符和回车符时,它们必须用两个字符串分隔。字符串具有以下格式
[CharSize][Inverted][Aligned]Data
例如,如果给我这样的数据
QString s1 = "[6][1][0]Data1\n\r[5][0][1]Data2";
当我将它们分开时,会有两个QString,我将把数据放在开括号和闭括号中。
另一个有效数据是这样的:
QString s2 = "[7][0][1]Data3"
无效数据如下:
QString s3 = "abc[8][1][1]Data4"
我在下面应用了以下QRegExp:
QRegExp clrf("\n\r|\r\n|\n");
QStringList sp = str.split(clrf);
QRegexp clrf适用于使用换行和回车分隔数据,反向或仅换行。注意:s1,s2和s3在这里处理得很好。
问题在于:
QRegExp value("[^a-z]?\\[([0-9a-z]+)\\]\\[([0-9a-z]+)\\]\\[([0-9a-z]+)\\]([A-Za-z0-9\\'\\ \"]*)");
当我使用上面的代码时,s1,s2和s3都被处理了。 S3 不应该处理,因为它的第一个字符不是开括号。你能帮我纠正我的QRegExp吗?
谢谢。
编辑: 整个代码:
void parseString(QString str)
{
QRegExp clrf("\n\r|\r\n|\n");
QRegExp value("\\[([0-9a-z]+)\\]\\[([0-9a-z]+)\\]\\[([0-9a-z]+)\\]([A-Za-z0-9\\'\\ \"]*)");
// QRegExp value("^\[(\\d+)\]\[(\\d+)\]\[(\\d+)\](.*)$");
int p = 0, i = 0;
int res;
int cs = 0, inv = 0, al = 0;
QStringList sp = str.split(clrf);
XLineString ls;
for (i = 0; i < sp.size(); ++i) {
res = value.indexIn(sp[i], p);
while (res != -1) {
printf("Text=[%s]\n", value.cap(EData).toStdString().c_str());
printf("Digit cs[%d] ", value.cap(ECharSize).toInt());
printf("inv[%d] ", value.cap(EInvert).toInt());
printf("al[%d]\n", value.cap(EAlignment).toInt());
cs = value.cap(ECharSize).toInt();
if (value.cap(EInvert).toInt())
inv = 1;
else
inv = 0;
if (value.cap(EAlignment).toInt())
al = 1;
else
al = 0;
ls.addLine(value.cap(EData).toStdString().c_str(), cs, inv, al);
p += value.matchedLength();
res = value.indexIn(str, p);
}
}
}
int main()
{
QString str1[] = {
"[12][0][0]DATA1\n\r[78][0][1]DATA2",
"abc[1][1][1]THIS SHOULD NOT PASS",
};
for (int i = 0; i < sizeof(str1) / sizeof(str1[0]); ++i)
parseString(str1[i]);
}
答案 0 :(得分:1)
为了回答您的问题,我已经使用PyQt5(为简单起见)对此进行了测试
import re
R = ["\\[([0-9a-z]+)\\]\\[([0-9a-z]+)\\]\\[([0-9a-z]+)\\]([A-Za-z0-9\\'\\ \"]*)", "^\[(\\d+)\]\[(\\d+)\]\[(\\d+)\](.*)$"]
tests = ["[6][1][0]Data1\n\r[5][0][1]Data2", "[7][0][1]Data3", "abc[8][1][1]Data4"]
s = re.compile("\n\r|\r\n|\n") # emulate QRegExp split feature
for r in R:
r=QRegExp(r)
for T in tests:
for t in s.split(T):
print(r.indexIn(t))
结果:
0
0
0
3
0
0
0
-1
结论:如果你只是测试那个&#34; indexIn&#34;你的原始匹配也可以工作。等于0而不是等于-1,而我的修改版本应该以任何一种方式工作。
我认为你最好的选择就是修改你的代码,确保索引等于0.我可能还建议你使用If语句而不是While语句,或者你可以重复匹配同一行。