C ++多字符串抓取器(正则表达式)

时间:2012-04-15 22:04:49

标签: c++ regex string boost boost-regex

我对boost :: regex有问题,此解决方案仅适用于每次匹配中的一个结果

boost::regex regex("id=\"(.*?)\""); // should I use this "id=\"(.*?)\"(.*?)<value>(.*?)</value>"?
boost::sregex_token_iterator iter(xml.begin(), xml.end(), regex, 1); // 1 because I just need text inside quotes
boost::sregex_token_iterator end;

现在解析了字符串

<x id="first">
<value>5</value>
</x>
<x id="second"> 
<value>56</value>  
</x>  
etc... 

现在的问题是如何在匹配循环

内同时解析id和value
for( ; iter != end; ++iter ) {
  std::string id(iter->first, iter->second);
  std::string value(?????);
}

1 个答案:

答案 0 :(得分:1)

Boost.PropertyTree包含一个XML解析器,您可以使用它而不是正则表达式:

#include <boost/property_tree/ptree.hpp>
#include <boost/property_tree/xml_parser.hpp>
#include <boost/foreach.hpp>
...    
using boost::property_tree::ptree;
ptree pt;
read_xml(istreamOrFilename, pt);
BOOST_FOREACH(ptree::value_type &v, pt) {
    std::string id(v.second.get<std::string>("<xmlattr>.id"));
    std::string value(v.second.get<std::string>("value").data());    
}