以下代码是产生问题的简化示例。
许多字符串(char *)被插入到集合中,其中许多字符串是非唯一的。应检测重复的字符串,并返回指向原始插入的指针;但是,有时这不会发生,并且已经插入的字符串会再次插入,就像它已经存在一样。
结果集应包括:" aa"," bb"," cc"。 输出显示该组最终得到:" bb"," cc"," aa"," bb"。 更改首次插入的字符串似乎会更改允许的副本。'
不使用字符串上的数字前缀,但添加了数字前缀以确保每个字符串都有唯一的指针;没有它们,问题仍然存在。
使用默认比较器和非前缀字符串确实按预期工作,但这只比较指针;为字符串添加前缀会产生唯一的指针,并插入所有字符串。
#include <iostream>
#include <set>
#include <cstring>
using std::cout;
using std::endl;
using std::set;
using std::pair;
typedef set<const char*>::const_iterator set_iter;
struct cmp_op {
int operator() (const char* x,const char* y) const {
int r = strcmp(x,y);
//cout << "cmp: " << x << ((r)?((r>0)?" > ":" < "):" == ") << y << endl;
return r;
}
};
int main() {
//first char ignored, just ensures unique pointers
const char* a[] = {"1bb","2aa","3aa","4bb","5cc","6aa","7bb","8cc","9bb"};
const size_t n = sizeof(a)/sizeof(*a);
//using custom (strcmp) comparator
set<const char*,cmp_op> s;
for (int i=0; i<n; ++i) {
cout << "insert(" << (void*)(a[i]+1) << "=" << (a[i]+1) << ")" << endl;
pair<set_iter,bool> r = s.insert(a[i]+1);
if (r.second) cout << "OK";
else {cout << "dup => " << (void*)(*r.first) << "=" << (*r.first);}
cout << endl << endl;
}
cout << n << " strings, " << s.size() << " unique:" << endl;
set_iter it=s.begin();
cout << (void*)(*it) << "=" << *it;
while (++it!=s.end())
cout << ", " << (void*)(*it) << "=" << *it;
cout << endl;
return 0;
}
我在Windows上使用MinGW和GCC 4.8.1;使用Ubuntu进行测试会产生相同的结果。
答案 0 :(得分:8)
您的比较函数未实现严格弱排序,因为只要LHS不等于RHS,它就会返回true
。当一个“小于”另一个时,你需要改变逻辑以返回true。这是一个例子,这似乎是一个自然的选择:
return r < 0;
请注意,要明确说明意图,最好返回bool
:
bool operator() (const char* x, const char* y) const
{
return strcmp(x, y) < 0;
}