在C ++中查找数组的模式(最常见的元素)

时间:2014-03-24 03:28:15

标签: c++

我在面试问题上有这个问题。我想看看StackOverflow是如何做到的。

Bjarne Stroustrop会怎么想我的方式?这有点罗嗦,但不幸的是,我不知道如何让它变得更好。我知道你们会嘲笑我的愚蠢。

template <class T>
T mode(T* arr, size_t n)
// If there's a tie, return an arbitrary element tied for 1st
// If the array size is 0, throw an error
{
   if (n == 0)
   {
       throw("Mode of array of size 0 is undefined, bro.");
   }
   else if (n == 1)
   {
       return arr[0];
   }
   else 
   {
      std::pair<T, int> highest(arr[0], 1);
      std::map<T, int> S;
      S.insert(highest);
      for (T* thisPtr(arr + 1), lastPtr(arr+n); thisPtr != lastPtr; ++thisPtr)
      {
          if (S.count(*thisPtr) == 0)
          {
             S.insert(std::pair<T, int> (*thisPtr, 1);
          }
          else 
          {
             ++S[*thisPtr];
             if (S[*thisPtr] > highest.second)
             {
                 highest = std::pair<T, int> (*thisPtr, S[*thisPtr]);
             }
          }
      }
   }
}

3 个答案:

答案 0 :(得分:1)

如果T实现std::hash

,您可以这样做
std::unordered_multiset<T> elems;
std::for_each(arr, arr + size, [&elems](T const & elem) { elems.insert(elem); }

//Now you have elems.count() for each entry
auto max_count = /*Guaranteed minimum value*/
T mode{};
for (auto const & set_elem : elems) {
    if (max(elems.count(set_elem), max_count) == max_count)) {
      mode = set_elem;
    }
}

答案 1 :(得分:1)

我想我会使用std::map进行计数,然后找到计数最多的项目:

template <class T>
T mode(T* arr, size_t n) {
    std::map<T, size_t> counts;

    for (size_t i=0; i<n; i++)
        ++counts[arr[i]];

    return max_element(counts.begin(), counts.end(), 
        [](std::pair<T, size_t> const &a, std::pair<T, size_t> const &b) {
            return a.second < b.second;
        })->first;
}

如果您期望有大量独特的项目,您可能希望使用std::unordered_map而不是std::map [应该将预期的复杂性从O(n log n)降低到O(N) ]

答案 2 :(得分:1)

我发现您的代码存在以下问题。

冗余检查n == 1

您可以删除块

else if (n == 1)
{
    return arr[0];
}

不影响结果。

for循环中变量的声明:

T* thisPtr(arr + 1), lastPtr(arr+n);`

相当于

T* thisPtr(arr + 10); T lastPtr(arr+n);

这不是你的意图。编译器也会报告错误。因此,将他们的声明移到for循环之外。变化

for (T* thisPtr(arr + 1), lastPtr(arr+n); thisPtr != lastPtr; ++thisPtr)

T* thisPtr(arr + 1);
T* lastPtr(arr+n);
for ( ; thisPtr != lastPtr; ++thisPtr)

简化for循环

的内容

if (S.count(*thisPtr) == 0)
{
   S.insert(std::pair<T, int> (*thisPtr, 1));
}

可以替换为

 ++S[*thisPtr];

这正是您在以下else块中所做的事情。

您可以将整个for循环的内容更改为:

++S[*thisPtr];
if (S[*thisPtr] > highest.second)
{
   highest = std::pair<T, int> (*thisPtr, S[*thisPtr]);
}

您需要返回模式

添加

  return highest.first;

关闭else块。