QRegularExpression的意外行为

时间:2016-11-07 23:08:24

标签: qt

我刚刚开始切换到QRegularExpression,我正在使用它来标记具有多个分隔符可能性的字符串。我遇到了一个令人惊讶的行为,在我看来这是一个错误。我在Windows上使用Qt 5.5.1。

以下是示例代码:

#include <QRegularExpression>
#include <QString>
#include <QtDebug>

int main(int argc, char *argv[])
{
    Q_UNUSED (argc);
    Q_UNUSED (argv);
    QRegularExpression regex ("^ ");

    qDebug () << "Expected:    " << QString ("M 100").indexOf(regex);
    qDebug () << "NOT expected:" << QString ("M 100").indexOf(regex, 1);
    qDebug () << "Expected:    " << QString (" 100").indexOf(regex);

    QRegularExpression regex1 (" ");
    qDebug () << "Expected:    " << QString ("M 100").indexOf(regex1);
}

输出:

Expected:     -1
NOT expected: -1
Expected:     0
Expected:     1

当在“indexOf”调用中使用非0的起始位置时使用插入符号(^)会阻止表达式匹配。直观地说,我期望插入符号匹配我指定位置的字符串。相反,它根本就不匹配。

我要切换我的标记化以使用splitRref来避免这个问题。虽然这可能稍微清洁一点,但我需要了解这是否是正确的行为,或者我是否应该向Qt报告错误。

更新:使用splitRef并不能完全解决我的问题,因为我需要使用正则表达式来检测某些标记是否是浮点数,而我不能将QRegularExpression与QStringRef一起使用。对于这种可能性,我必须将我的QStringRef标记转换为实际的QString,这是我首先想要避免的。

1 个答案:

答案 0 :(得分:1)

^在主题字符串的开头匹配,或在多线模式下的换行符后 。偏移量不会改变这些语义。因此,正确匹配/^ /(正则表达式)与偏移量为1的M 100会导致不匹配。

也许你想要\G?来自pcrepattern(3)

  

\G匹配主题中的第一个匹配位置

     

仅当当前匹配位置位于匹配的起始点时,\G断言才为真,如pcre_exec() startoffset 参数所指定。当 startoffset 的值不为零时,它与\A不同。

这样,这段代码:

QRegularExpression regex ("\\G ");

qDebug () << "Expected:    " << QString ("M 100").indexOf(regex);
qDebug () << "NOT expected:" << QString ("M 100").indexOf(regex, 1);
qDebug () << "Expected:    " << QString (" 100").indexOf(regex);

打印

Expected:     -1
NOT expected: 1
Expected:     0