MSVC正则表达式匹配

时间:2015-11-03 09:52:12

标签: c++ regex visual-c++

我正在尝试匹配一个字面数字,例如1600442在Microsoft Visual Studio 2010中使用一组正则表达式。我的正则表达式很简单:

1600442|7654321
7895432

问题是以上两者都匹配字符串。

在Python中实现它会产生预期的结果: 导入重新

serial = "1600442"
re1 = "1600442|7654321"
re2 = "7895432"

m = re.match(re1, serial)
if m:
    print "found for re1"
    print m.groups()

m = re.match(re2, serial)
if m:
    print "found for re2"
    print m.groups()

提供输出

found for re1
()

这是我的预期。但是在C ++中使用此代码:

#include <string>
#include <iostream>
#include <regex>

int main(){
    std::string serial = "1600442";
    std::tr1::regex re1("1600442|7654321");
    std::tr1::regex re2("7895432");

    std::tr1::smatch match;

    std::cout << "re1:" << std::endl;
    std::tr1::regex_search(serial, match, re1);
    for (auto i = 0;i <match.length(); ++i)
            std::cout << match[i].str().c_str() << " ";

    std::cout << std::endl << "re2:" << std::endl;
    std::tr1::regex_search(serial, match, re2);
    for (auto i = 0;i <match.length(); ++i)
            std::cout << match[i].str().c_str() << " ";
    std::cout << std::endl;
    std::string s;
    std::getline (std::cin,s);
}

给了我:

re1:
1600442
re2:
1600442

这不是我的预期。为什么我在这里得到匹配?

1 个答案:

答案 0 :(得分:0)

smatch的第二次调用不会覆盖regex_search,因此,它保持不变并包含第一批结果。

您可以将正则表达式搜索代码移动到单独的方法:

void FindMeText(std::regex re, std::string serial) 
{
    std::smatch match;
    std::regex_search(serial, match, re);
    for (auto i = 0;i <match.length(); ++i)
            std::cout << match[i].str().c_str() << " ";
    std::cout << std::endl;
}

int main(){
    std::string serial = "1600442";
    std::regex re1("^(?:1600442|7654321)");
    std::regex re2("^7895432");
    std::cout << "re1:" << std::endl;
    FindMeText(re1, serial);
    std::cout << "re2:" << std::endl;
    FindMeText(re2, serial);
    std::cout << std::endl;
    std::string s;
    std::getline (std::cin,s);
}

结果:

enter image description here

请注意,Python re.match仅在字符串的开头搜索模式匹配,因此我建议在每个模式的开头使用^(字符串的开头)。