regex_token_iterator * it ++ bug?

时间:2013-12-02 08:19:55

标签: c++ regex c++11

代码如下:

#include<iostream>
#include<regex>

using namespace std;

int main(int argc, char *argv[]) 
{
    regex reg("/");
    string s = "Split/Values/Separated/By/Slashes";
    sregex_token_iterator it{std::begin(s), std::end(s), reg, -1};
    sregex_token_iterator end;

    while(it != end)
    {
        cout << *it++ << endl;
    }

    return 0;
}

应输出:

Split
Values
Separated
By
Slashes

但它输出了这个:

Values
Separated
By

Slashes

主要代码可能是问题*it++,如果我写cout << *it << endl;++it;,它就可以了。

当我将stand c ++ 11 regex更改为boost-regex时,*it++也正常工作。

我已经检查了正则表达式的头部,我认为operator++(int)函数没有问题。

我的铿锵声版本是

Apple LLVM version 5.0 (clang-500.2.79) (based on LLVM 3.3svn) 
Target: x86_64-apple-darwin13.0.0
Thread model: posix

有没有人有这样的问题?

clang中有错误吗?

1 个答案:

答案 0 :(得分:3)

我发现这是一个libc ++实现错误。

转到正则表达式,插入以下两行

    regex_token_iterator operator++(int)
    {
        regex_token_iterator __t(*this);
std::cout << "test---" << *__t << "---test" << endl;
        ++(*this);
std::cout << "test---" << *__t << "---test" << endl;
        return __t;
    }

你发现++(* this)之后* __ t的值发生了变化!

进一步挖掘你会发现,

* __ t实际上是通过返回内部value_type指针_ 结果来实现的,而_ 结果实际上指向&amp; _ 位置 - &gt; prefix(),这是match_results'_ 前缀对象的地址,该对象的地址从未改变,但其内容发生了变化。