我刚刚开始切换到QRegularExpression,我正在使用它来标记具有多个分隔符可能性的字符串。我遇到了一个令人惊讶的行为,在我看来这是一个错误。我在Windows上使用Qt 5.5.1。
以下是示例代码:
#include <QRegularExpression>
#include <QString>
#include <QtDebug>
int main(int argc, char *argv[])
{
Q_UNUSED (argc);
Q_UNUSED (argv);
QRegularExpression regex ("^ ");
qDebug () << "Expected: " << QString ("M 100").indexOf(regex);
qDebug () << "NOT expected:" << QString ("M 100").indexOf(regex, 1);
qDebug () << "Expected: " << QString (" 100").indexOf(regex);
QRegularExpression regex1 (" ");
qDebug () << "Expected: " << QString ("M 100").indexOf(regex1);
}
输出:
Expected: -1
NOT expected: -1
Expected: 0
Expected: 1
当在“indexOf”调用中使用非0的起始位置时使用插入符号(^)会阻止表达式匹配。直观地说,我期望插入符号匹配我指定位置的字符串。相反,它根本就不匹配。
我要切换我的标记化以使用splitRref来避免这个问题。虽然这可能稍微清洁一点,但我需要了解这是否是正确的行为,或者我是否应该向Qt报告错误。
更新:使用splitRef并不能完全解决我的问题,因为我需要使用正则表达式来检测某些标记是否是浮点数,而我不能将QRegularExpression与QStringRef一起使用。对于这种可能性,我必须将我的QStringRef标记转换为实际的QString,这是我首先想要避免的。
答案 0 :(得分:1)
^
在主题字符串的开头匹配,或在多线模式下的换行符后 。偏移量不会改变这些语义。因此,正确匹配/^ /
(正则表达式)与偏移量为1的M 100
会导致不匹配。
也许你想要\G
?来自pcrepattern(3)
:
\G
匹配主题中的第一个匹配位置仅当当前匹配位置位于匹配的起始点时,
\G
断言才为真,如pcre_exec()
的 startoffset 参数所指定。当 startoffset 的值不为零时,它与\A
不同。
这样,这段代码:
QRegularExpression regex ("\\G ");
qDebug () << "Expected: " << QString ("M 100").indexOf(regex);
qDebug () << "NOT expected:" << QString ("M 100").indexOf(regex, 1);
qDebug () << "Expected: " << QString (" 100").indexOf(regex);
打印
Expected: -1
NOT expected: 1
Expected: 0