标准库算法是否允许复制谓词参数?

时间:2012-06-17 13:16:56

标签: c++ g++ functor stl-algorithm

假设我们要从int s的向量中删除重复值。通常的解决方案是使用擦除 - 移除习语对矢量进行排序并擦除重复项。但我们需要保留不会被删除的元素的顺序,所以我们无法排序。因此,有人可能会提出这样的谓词并与remove_if算法一起使用:

struct comp {
    std::set<int> s;
    comp() : s() {}
    bool operator()(int i)
    {
        return !(s.insert(i)).second;
    }
};

但是如果出于某种原因将复制谓词对象,这将会中断,因为我们将获得set成员的两个副本。事实上,gcc的remove_if实现完全正确:

template<typename _ForwardIterator, typename _Predicate>
    _ForwardIterator
    remove_if(_ForwardIterator __first, _ForwardIterator __last,
          _Predicate __pred)
    {

      __first = _GLIBCXX_STD_A::find_if(__first, __last, __pred);

      if(__first == __last)                             // ^^^^^ here a copy is made
        return __first;
      _ForwardIterator __result = __first;
      ++__first;
      for(; __first != __last; ++__first)
        if(!bool(__pred(*__first)))
          {
            *__result = _GLIBCXX_MOVE(*__first);
            ++__result;
          }
      return __result;
    }

解决方法是让set我们的仿函数成员静态:

struct comp {
    static set<int> s;
    comp() { s. clear(); }
    bool operator()(int i)
    {
        return !(s.insert(i)).second;
    }
};
set<int> comp::s;

但问题仍然存在:

我们是否需要确保谓词仿函数的可能副本不会破坏我们的逻辑? 标准中是否有任何要求(或禁止)针对此问题的某些行为?或者它是实施中的错误?

3 个答案:

答案 0 :(得分:5)

是的,标准没有指定谓词复制的次数,也没有说明谓词将以什么顺序应用于容器的元素。从本质上讲,谓词必须像pure functions一样;他们必须没有可观察的状态。 1

所以remove_if听起来不像是一个合适的算法。诸如将set外部存储到仿函数中的黑客将无法解决问题;你仍然会调用未定义的行为。

<小时/> <子> 1。有关更深入的讨论,请参阅Scott Meyers'Effective STL的第39项(“使谓词纯函数”)。

答案 1 :(得分:3)

  

我们是否需要确保谓词仿函数的可能副本不会破坏我们的逻辑?

是的,您应该假设复制了谓词。在C ++ 11中,您可以考虑使用std::ref or std::cref

另一种方法是修改您的comp结构,以便通过引用获取set

struct comp {
    std::set<int>& s;
    comp(std::set<int> s) : s(s) {}
    bool operator()(int i)
    {
        return !(s.insert(i)).second;
    }
};

注意:我没有说明这是否适用于remove_if,我只是解决了包含不应复制的状态的复制谓词的问题。

编辑正如评论中指出的那样,这种方法从根本上被打破了。谓词调用的结果不应该依赖于可变状态。

答案 2 :(得分:2)

是的,允许他们复制参数的次数不确定。比将成员设置为静态更好的方法是在仿函数之外创建集合并将其作为构造函数参数传递。内部存储指针。