我试图使用正则表达式在C ++中编写分割函数。到目前为止,我已经提出了这个问题;
vector<string> split(string s, regex r)
{
vector<string> splits;
while (regex_search(s, r))
{
int split_on = // index of regex match
splits.push_back(s.substr(0, split_on));
s = s.substr(split_on + 1);
}
splits.push_back(s);
return splits;
}
我想知道的是如何填写注释行。
答案 0 :(得分:7)
您只需要多一点,但请参阅下面代码中的注释。男人的诀窍是使用匹配对象,std::smatch
,因为你匹配std::string
,以记住你匹配的地方(不仅仅是你做过的):< / p>
vector<string> split(string s, regex r)
{
vector<string> splits;
smatch m; // <-- need a match object
while (regex_search(s, m, r)) // <-- use it here to get the match
{
int split_on = m.position(); // <-- use the match position
splits.push_back(s.substr(0, split_on));
s = s.substr(split_on + m.length()); // <-- also, skip the whole match
}
if(!s.empty()) {
splits.push_back(s); // and there may be one last token at the end
}
return splits;
}
这可以这样使用:
auto v = split("foo1bar2baz345qux", std::regex("[0-9]+"));
并会给你"foo", "bar", "baz", "qux"
。
std::smatch
是std::match_results
的专精,其参考文档存在here。