regex_token_iterator和regex_iterator之间有什么区别吗?
看起来他们都做同样的工作,但不确定哪一个是更好的表现?
答案 0 :(得分:12)
确实存在差异,如果我们看一下cppreference它描述std::regex_iterator如下:
std :: regex_iterator是一个只读的ForwardIterator,用于访问基础字符序列中正则表达式的各个匹配项。
和std::regex_token_iterator as:
std :: regex_token_iterator是一个只读的ForwardIterator,用于访问基础字符序列中正则表达式的每个匹配项的各个子匹配项。它还可以用于访问序列中与给定正则表达式不匹配的部分(例如,作为标记化器)。
因此,std::regex_token_iterator
还允许您匹配不匹配的令牌或n-th
子表达式。
我上面链接的std::regex_token_iterator
的cppreference部分描述了一个典型的实现,如下所示:
std :: regex_token_iterator的典型实现包含 底层std :: regex_iterator,一个容器(例如std :: vector) 请求的子匹配索引,内部计数器等于 submatch的索引,指向std :: sub_match的指针,指向 当前匹配的当前子匹配,以及std :: match_results对象 包含最后一个不匹配的字符序列(在tokenizer中使用) 模式)。
本书The C++ Standard Library在14.4
Regex令牌迭代器中解释如下:
正则表达式迭代器有助于迭代匹配的子序列。然而, 有时你也想处理匹配之间的所有内容 表达式。 [...]此外,您还可以指定积分列表 值,表示“标记化”的元素:
- -1表示您对匹配的正则表达式(标记分隔符)之间的所有子序列感兴趣。
- 0表示您对所有匹配的正则表达式(标记分隔符)感兴趣。
- 任何其他值n表示您对正则表达式中匹配的第n个子表达式感兴趣。
图书网站提供了sregex_token_iterator和sregex_iterator的示例代码,这些代码也应该有所帮助。