我想知道如何使用min heap来解决以下问题。
我想解决的是使用哈希表并保存数字的计数。但我不知道如何使用min heap来解决这个问题。
给定一个非空的整数数组,返回k个最常见的元素。
例如, 给定[1,1,1,2,2,3]和k = 2,返回[1,2]。
注意: 您可以假设k始终有效,1≤k≤唯一元素的数量。 算法的时间复杂度必须优于O(n log n),其中n是数组的大小。
vector<int> topKFrequent(vector<int>& nums, int k) {
unordered_map<int, int> counts;
priority_queue<int, vector<int>, greater<int>> max_k;
for(auto i : nums) ++counts[i];
for(auto & i : counts) {
max_k.push(i.second);
// Size of the min heap is maintained at equal to or below k
while(max_k.size() > k) max_k.pop();
}
vector<int> res;
for(auto & i : counts) {
if(i.second >= max_k.top()) res.push_back(i.first);
}
return res;
}
答案 0 :(得分:2)
代码的工作原理如下:
for(auto i : nums) ++counts[i]; // Use a map to count how many times the
// individual number is present in input
priority_queue<int, vector<int>, greater<int>> max_k; // Use a priority_queue
// which have the smallest
// number at top
for(auto & i : counts) {
max_k.push(i.second); // Put the number of times each number occurred
// into the priority_queue
while(max_k.size() > k) max_k.pop(); // If the queue contains more than
// k elements remove the smallest
// value. This is done because
// you only need to track the k
// most frequent numbers
vector<int> res; // Find the input numbers
for(auto & i : counts) { // which is among the most
if(i.second >= max_k.top()) res.push_back(i.first); // frequent numbers
// by comparing their
// count to the lowest of
// the k most frequent.
// Return numbers whose
// frequencies are among
// the top k
修改
正如@SergeyTachenov How min heap is used here to solve this所指出的,你的结果向量可能会返回多于k个元素。也许你可以通过这样做来解决这个问题:
for(auto & i : counts) {
if(i.second >= max_k.top()) res.push_back(i.first);
if (res.size() == k) break; // Stop when k numbers are found
}
另一个小评论
你真的不需要while
- 声明:
while(max_k.size() > k) max_k.pop();
if
- 声明可以。