检查unordered_set是否包含其他unordered_set中的所有元素 - C ++

时间:2018-01-17 10:56:29

标签: c++ unordered-set

我是C ++的新手,并被要求将Java程序转换为C ++。 我试图编写一个方法来检查unordered_set中的所有元素是否存在于另一个unordered_set中。我发现下面的示例使用hash_set但不推荐使用hash_set,建议现在使用unordered_set。

// returns true if one contains all elements in two
bool SpecSet::containsAll(hash_set<Species*> one, hash_set<Species*> two) {
   sort(one.begin(), one.end());
   sort(two.begin(), two.end());
   return includes(one.begin(), one.end(), two.begin(), two.end());
}

所以我需要一种方法来使用unordered_set来做到这一点。排序不适用于无序集,查找速度很重要,因此我不想使用有序集。

bool SpecSet::containsAll(unordered_set<Species*> one, unordered_set<Species*> two) {

   return ?;
}

我非常感谢有效帮助您实现这一目标的方法。

编辑: 我想这会奏效。似乎没有更有效的方法可以循环使用两种方法。

bool SpecSet::containsAll(unordered_set<Species*> one, unordered_set<Species*> two) {
   if(two.size() > one.size())
   {
      return false;
   }

   for(Species *species : two)
   {
      if(one.find(species) == one.end())
      {
         return false;
      }
   }
   return true;
}

2 个答案:

答案 0 :(得分:1)

免责声明:这不是最有效的方法。在支持无序迭代器范围的同时,尝试解决方案与std::includes一样通用且灵活。它不仅限于std::unordered_set,也适用于任何其他容器,例如std::vectorstd::list

正如所指出的那样std::includes需要对输入范围进行排序。此时标准库不支持无序范围。

查看std::includes的可能实现,可以实现无序范围的版本。例如:

template<class InputIt1, class InputIt2>
bool includes_unordered(
    InputIt1 first1, InputIt1 last1,
    InputIt2 first2, InputIt2 last2)
{
    for (; first2 != last2; ++first2)
    {
        InputIt1 it1;
        for (it1 = first1; it1 != last1; ++it1)
        {
            if(*first2 == *it1)
                break;
        }
        if (it1 == last1)
            return false;
    }
    return true;
}

注意:容器&#39;不执行大小比较优化以支持非唯一对象的容器。但如果需要,可以使用std::distance完成。

这是一个采用等价运算符的版本:

template<class InputIt1, class InputIt2, class Equivalence>
bool includes_unordered(
    InputIt1 first1, InputIt1 last1,
    InputIt2 first2, InputIt2 last2,
    Equivalence equiv)
{
    for (; first2 != last2; ++first2)
    {
        InputIt1 it1;
        for (it1 = first1; it1 != last1; ++it1)
        {
            if(equiv(*first2, *it1))
                break;
        }
        if (it1 == last1)
            return false;
    }
    return true;
}

Small live-example

然后includes_unordered的使用方式与std::includes相同。

答案 1 :(得分:1)

对于未分类的集合,在测试每个元素是较大集合的成员时,没有比迭代较小集合更快的算法。这自然会缩放为O( n ),其中 n 是推定子集的大小,因为我们执行O(1)查找操作 n 次。

以下是一些演示代码,包括测试:

#include <unordered_set>

template <typename T>
bool is_subset_of(const std::unordered_set<T>& a, const std::unordered_set<T>& b)
{
    // return true if all members of a are also in b
    if (a.size() > b.size())
        return false;

    auto const not_found = b.end();
    for (auto const& element: a)
        if (b.find(element) == not_found)
            return false;

    return true;
}
int main()
{
    const std::unordered_set<int> empty{ };
    const std::unordered_set<int> small{ 1, 2, 3 };
    const std::unordered_set<int> large{ 0, 1, 2, 3, 4 };
    const std::unordered_set<int> other{ 0, 1, 2, 3, 9 };

    return 0
        +  is_subset_of(small, empty) // small ⊄ ∅
        + !is_subset_of(empty, small) // ∅ ⊂ small
        +  is_subset_of(large, small) // large ⊄ small
        + !is_subset_of(small, large) // small ⊂ large
        +  is_subset_of(large, other) // large ⊄ other
        +  is_subset_of(other, large) // other ⊄ large
        + !is_subset_of(empty, empty) // ∅ ⊂ ∅
        + !is_subset_of(large, large) // x ⊂ x, ∀x
        ;
}

等效,使用标准算法而不是编写显式循环:

#include <algorithm>
#include <unordered_set>

template <typename T>
bool is_subset_of(const std::unordered_set<T>& a, const std::unordered_set<T>& b)
{
    // return true if all members of a are also in b
    auto const is_in_b = [&b](auto const& x){ return b.find(x) != b.end(); };

    return a.size() <= b.size() && std::all_of(a.begin(), a.end(), is_in_b);
}

(显然使用相同的main()进行测试)

请注意,我们通过引用传递集合,而不是按值传递,因为您已经指出集合太大而无法复制和排序。