使用自定义比较器设置的STL允许重复元素

时间:2014-06-30 13:24:15

标签: c++ stl set comparator

以下代码是产生问题的简化示例。

许多字符串(char *)被插入到集合中,其中许多字符串是非唯一的。应检测重复的字符串,并返回指向原始插入的指针;但是,有时这不会发生,并且已经插入的字符串会再次插入,就像它已经存在一样。

结果集应包括:" aa"," bb"," cc"。 输出显示该组最终得到:" bb"," cc"," aa"," bb"。 更改首次插入的字符串似乎会更改允许的副本。'

不使用字符串上的数字前缀,但添加了数字前缀以确保每个字符串都有唯一的指针;没有它们,问题仍然存在。

使用默认比较器和非前缀字符串确实按预期工作,但这只比较指针;为字符串添加前缀会产生唯一的指针,并插入所有字符串。

#include <iostream>
#include <set>
#include <cstring>

using std::cout;
using std::endl;
using std::set;
using std::pair;

typedef set<const char*>::const_iterator set_iter;

struct cmp_op {
    int operator() (const char* x,const char* y) const {
        int r = strcmp(x,y);
        //cout << "cmp: " << x << ((r)?((r>0)?" > ":" < "):" == ") << y << endl;
        return r;
    }
};

int main() {
    //first char ignored, just ensures unique pointers
    const char* a[] = {"1bb","2aa","3aa","4bb","5cc","6aa","7bb","8cc","9bb"};
    const size_t n = sizeof(a)/sizeof(*a);

    //using custom (strcmp) comparator
    set<const char*,cmp_op> s;

    for (int i=0; i<n; ++i) {
        cout << "insert(" << (void*)(a[i]+1) << "=" << (a[i]+1) << ")" << endl;
        pair<set_iter,bool> r = s.insert(a[i]+1);
        if (r.second) cout << "OK";
        else {cout << "dup => " << (void*)(*r.first) << "=" << (*r.first);}
        cout << endl << endl;
    }

    cout << n << " strings, " << s.size() << " unique:" << endl;
    set_iter it=s.begin();
    cout << (void*)(*it) << "=" << *it;
    while (++it!=s.end())
        cout << ", " << (void*)(*it) << "=" << *it;
    cout << endl;

    return 0;
}

我在Windows上使用MinGW和GCC 4.8.1;使用Ubuntu进行测试会产生相同的结果。

1 个答案:

答案 0 :(得分:8)

您的比较函数未实现严格弱排序,因为只要LHS不等于RHS,它就会返回true。当一个“小于”另一个时,你需要改变逻辑以返回true。这是一个例子,这似乎是一个自然的选择:

return r < 0;

请注意,要明确说明意图,最好返回bool

bool operator() (const char* x, const char* y) const 
{
  return strcmp(x, y) < 0;
}