如何修改正则表达式字符串

时间:2018-04-27 03:53:26

标签: c++ regex

表示输入字符串

std::string input_string = ";;abc,123;,,;456,def;789,ghi,135,jkl";

我想从输入字符串中只得到分号闭包中的“数字,字符串”对。在这种情况下,“456,def”是唯一的匹配。

这是我的代码

std::regex regex("(\\d+),([^,;]+)(?:;|$)");
for (std::sregex_iterator it(input_string.begin(), input_string.end(), regex), itEnd; it != itEnd; ++it) {
    std::cout << it->str(1) << ", " << it->str(2) << std::endl;
}

但是这段代码也得到“135,jkl”作为结果

请帮我修改正则表达式字符串?

2 个答案:

答案 0 :(得分:1)

因此,为前导分号添加一个非捕获组:

std::regex regex("(?:^|;)(\\d+),([^,;]+)(?=;|$)");

或者,既然你正在迭代它们,那就用AWK方式做吧!

// iterate through ;-separated fields
for(std::sregex_iterator it(
                input_string.begin(), input_string.end(), std::regex("[^;]+"))
            , itEnd
        ; it != itEnd
        ; ++it)
{
    if(std::regex_match(it->str(0), std::regex("\\d+,[^,]*"))) {
        std::cout << it->str(0) << std::endl;
    }
}

答案 1 :(得分:0)

好像你让事情复杂化了!

以下简单的正则表达式可以正常工作:

;(\d+,[a-zA-Z]+);

我正在寻找的是多个数字,然后是一个逗号,然后是多个字母;它包含在两侧的分号中。确保已打开global标记以捕获所有此类情况。

P.S。:我假设字符串部分只包含英文字母(a到z,不区分大小写)。

Demo