有条件地用字符串替换正则表达式匹配

时间:2012-07-16 16:46:35

标签: c++ regex visual-studio-2010 visual-c++ c++11

我正在尝试用不同的替换模式替换字符串中的某些模式。

示例:

string test = "test replacing \"these characters\"";

我想要做的是将所有''替换为'_'以及所有其他非字母或数字字符替换为空字符串。我创建了以下正则表达式并且它似乎正确地标记,但我不确定如何(如果可能)使用regex_replace执行条件替换。

string test = "test replacing \"these characters\"";
regex reg("(\\s+)|(\\W+)");
替换后的预期结果是:

string result = "test_replacing_these_characters";

编辑: 我不能使用boost,这就是为什么我把它从标签中删除了。所以请不要回答包括提升。我必须使用标准库。可能是一个不同的正则表达式会完成目标,或者我只是被困了两次。

EDIT2: 我不记得在我的原始正则表达式时\w中包含了哪些字符,在查找之后我进一步简化了表达式。再一次,目标是任何匹配\ s +应该用'_'替换,任何匹配\ W +的东西都应该用空字符串替换。

2 个答案:

答案 0 :(得分:25)

每种情况下的c ++(0x,11,tr1)正则表达式do not really work (stackoverflow)(查找gcc的phrase regex on this page),因此最好use boost一段时间。

如果您的编译器支持所需的正则表达式,您可以尝试:

#include <string>
#include <iostream>
#include <regex>

using namespace std;

int main(int argc, char * argv[]) {
    string test = "test replacing \"these characters\"";
    regex reg("[^\\w]+");
    test = regex_replace(test, reg, "_");
    cout << test << endl;
}

上述内容适用于Visual Studio 2012Rc。

编辑1 :要在一次传递中替换两个不同的字符串(取决于匹配),我认为这在此处不起作用。在Perl中,这可以在评估的替换表达式(/e switch)中轻松完成。

因此,您需要两次通过,如您所怀疑的那样:

 ...
 string test = "test replacing \"these characters\"";
 test = regex_replace(test, regex("\\s+"), "_");
 test = regex_replace(test, regex("\\W+"), "");
 ...

编辑2

如果可以在tr()中使用回调函数 regex_replace,那么您可以在那里修改替换,例如:

 string output = regex_replace(test, regex("\\s+|\\W+"), tr);

tr()进行替换工作:

 string tr(const smatch &m) { return m[0].str()[0] == ' ' ? "_" : ""; }
问题本来可以解决了。不幸的是,在某些C ++ 11正则表达式实现中有没有这样的重载,但是Boost has one 。以下内容适用于boost并使用一遍:

...
#include <boost/regex.hpp>
using namespace boost;
...
string tr(const smatch &m) { return m[0].str()[0] == ' ' ? "_" : ""; }
...

string test = "test replacing \"these characters\"";
test = regex_replace(test, regex("\\s+|\\W+"), tr);   // <= works in Boost
...

也许有一天,这将适用于C ++ 11 或接下来的任何数字。

此致

RBO

答案 1 :(得分:-1)

执行此操作的方法通常是通过使用四个反斜杠来移除影响实际 C 代码的反斜杠。然后,您需要对括号进行第二次传递,然后在您的正则表达式中将它们转义。

string tet = "test replacing \"these characters\"";
//regex reg("[^\\w]+");
regex reg("\\\\"); //--AS COMMONLY TAUGHT AND EXPLAINED
tet = regex_replace(tet, reg, " ");
cout << tet << endl;

regex reg2("\""); //--AS SHOWN
tet = regex_replace(tet, reg2, " "); 
cout << tet << endl;

单次使用;

string tet = "test replacing \"these characters\"";
//regex reg("[^\\w]+");
regex reg3("\\\""); //--AS EXPLAINED
tet = regex_replace(tet, reg3, "");
cout << tet << endl;