将自定义数据推入priority_queue时出现无效的堆错误

时间:2015-07-18 08:28:26

标签: c++ heap priority-queue

我现在正在尝试解决一个问题,该问题要求我在k维矩阵中找到最常见的2频繁数字。

我定义了一个结构numCount,它有两个字段:number用于存储数字,count用于存储其出现次数。然后我访问矩阵中的每个数字,如果它的numCount结构已存在于最大堆中(按count排序),我只需将count增加1;否则我创建一个新的numCount对象并将其推入堆中。请注意,为了有效地获取与数字对应的numCount对象,我保留unordered_map的对应关系。

我的想法的主要逻辑显示在以下代码中。但是,在向堆中添加一些push对象后,invalid heap操作会出现numCount错误。

struct numCount {
    int number;
    int count;
    numCount(int num) : number(num), count(1) {}
};

struct compare {
    bool operator() (numCount*& lhs, numCount*& rhs) {
        return lhs -> count > rhs -> count;
    }
};

vector<int> kPopular(vector<vector<int> >& nums, int k) {
    int m = nums.size(), n = nums[0].size();
    priority_queue<numCount*, vector<numCount*>, compare> pq;
    unordered_map<int, numCount*> mp;
    for (int i = 0; i < m; i++) {
        for (int j = 0; j < n; j++) {
            if (mp.find(nums[i][j]) != mp.end())
                mp[nums[i][j]] -> count++;
            else {
                numCount* ncnt = new numCount(nums[i][j]);
                pq.push(ncnt); // This line gives the "invalid heap" error.
                mp[nums[i][j]] = ncnt;               
            }
        }
    }
    vector<int> popular(k);
    for (int i = 0; i < k; i++) {
        popular[i] = pq.top() -> number;
        pq.pop();
    }
    return popular;
}

我在以下矩阵上测试此代码:

nums = [[1, 1, 2],
        [2, 2, 3]
        [1, 2, 3]]

然后在尝试添加与invalid heap处的第一个numCount对应的3对象时,会抛出nums[1][2]错误。

如何修复此错误?

已更新:在收到@JSF的建议后,我更新了我的代码,如下所示。

struct compare {
    bool operator() (const pair<int, int>& lhs, const pair<int, int>& rhs) const {
        return lhs.second < rhs.second;
    }
};

vector<int> kPopular(vector<vector<int> >& nums, int k) {
    int m = nums.size(), n = nums[0].size();
    unordered_map<int, int> counts;
    for (int i = 0; i < m; i++)
        for (int j = 0; j < n; j++)
            counts[nums[i][j]]++;
    set<pair<int, int>, compare> st;
    for (auto pr : counts) {
        st.insert(pr);
        if ((int)st.size() > k)
            st.erase(st.begin());
    }
    vector<int> popular(k);
    set<pair<int, int>, compare>::iterator itr = st.begin();
    for (int i = 0; i < k; i++) {
        popular[i] = (*itr).first;
        itr = st.erase(itr);
    }
    return popular;
}

1 个答案:

答案 0 :(得分:0)

修改优先级队列中现有条目的密钥既是问题的原因,也是正确完成的巨大混乱。为了您的目的,根本不需要这样做 保持优先级队列递增没有任何目的,您已经识别并使您的算法效率低下,以及创建难以纠正的上述问题。

相反,您应首先阅读所有数据并计算所有计数。从数字到数字的映射对于该阶段来说要简单得多,并且比你的额外间接级别更有效。

计算完所有计数后,您就可以找到最大的k。优先级队列是找到k最大的好工具的一种可能性,但是有效使用该队列将涉及逆转k的意义。构建一个最多可容纳k个项目的队列,并始终识别最小的(不是最大的k个项目)。在Q中插入第一个k number,count对,然后对于其余的每一对,将其与Q中的最小值进行比较,并将Q中的最小值替换为新对,如果新对大于旧的最小值

如果您有充分的理由在计算计数时保持增量Q,那么这个原因在您的帖子中并不明显,您应该明确说明。使用支持更改现有项的键的优先级队列并非不可能。我需要在我自己的工作中的许多地方,并选择编写我自己的优先级队列(而不是使用std)来使这方面更容易。编写自己的编码不是那么难,但可能还有一种方法可以使用std版本。但在进入这种复杂性之前,先解释为什么问题需要它。