regex_token_iterator和regex_iterator有什么区别?

时间:2014-10-12 01:34:16

标签: c++ regex

regex_token_iterator和regex_iterator之间有什么区别吗?

看起来他们都做同样的工作,但不确定哪一个是更好的表现?

1 个答案:

答案 0 :(得分:12)

确实存在差异,如果我们看一下cppreference它描述std::regex_iterator如下:

  

std :: regex_iterator是一个只读的ForwardIterator,用于访问基础字符序列中正则表达式的各个匹配项。

std::regex_token_iterator as:

  

std :: regex_token_iterator是一个只读的ForwardIterator,用于访问基础字符序列中正则表达式的每个匹配项的各个子匹配项。它还可以用于访问序列中与给定正则表达式不匹配的部分(例如,作为标记化器)。

因此,std::regex_token_iterator还允许您匹配不匹配的令牌或n-th子表达式。

我上面链接的std::regex_token_iterator的cppreference部分描述了一个典型的实现,如下所示:

  

std :: regex_token_iterator的典型实现包含   底层std :: regex_iterator,一个容器(例如std :: vector)   请求的子匹配索引,内部计数器等于   submatch的索引,指向std :: sub_match的指针,指向   当前匹配的当前子匹配,以及std :: match_results对象   包含最后一个不匹配的字符序列(在tokenizer中使用)   模式)。

本书The C++ Standard Library14.4 Regex令牌迭代器中解释如下:

  

正则表达式迭代器有助于迭代匹配的子序列。然而,   有时你也想处理匹配之间的所有内容   表达式。 [...]此外,您还可以指定积分列表   值,表示“标记化”的元素:

     
      
  • -1表示您对匹配的正则表达式(标记分隔符)之间的所有子序列感兴趣。
  •   
  • 0表示您对所有匹配的正则表达式(标记分隔符)感兴趣。
  •   
  • 任何其他值n表示您对正则表达式中匹配的第n个子表达式感兴趣。
  •   

图书网站提供了sregex_token_iteratorsregex_iterator的示例代码,这些代码也应该有所帮助。