寻找提供随机和“顺序”访问的数据结构

时间:2015-12-27 15:29:40

标签: c++ data-structures stl

这是我经常遇到的编程问题,并且想知道是否存在数据结构,无论是在C ++ STL还是我自己实现的,都提供随机和顺序访问。

我可能需要这个的一个例子:

  • 假设有n种类型的项目(例如,n = 1000000),并且每种类型的项目都有固定数量(例如,0或10)

  • 我将这些项目存储到一个数组中,其中数组索引表示项目的类型,值表示该类型的项目有多少

  • 现在,我有一个迭代所有现有项目的算法。要获得这些项目,当所有条目都为0时迭代整个数组是非常浪费的,除了数组[99999]和数组[999999]。

通常,我通过使用链表来解决这个问题,该链表保存了所有非零数组条目的索引。我以这种方式实现标准操作:

插入(int t):

1)如果Array [t] == 0,LinkedList.push_back(t);

2)Array [t] ++;

删除(int t):

1)如果Array [t] == 1,则从LinkedList中找到并删除t;

2)数组[t] - ;

如果我想要删除操作的O(1)复杂性,我将数组存储容器而不是整数。每个容器都包含一个整数和指向LinkedList各自元素的指针,因此我不必搜索列表。

我很想知道是否存在正式化/改进此方法的数据结构,或者是否有更好的方法来完成此操作。

1 个答案:

答案 0 :(得分:6)

考虑到以下要求:

  • 随机访问
  • 快速查找
  • 快速插入
  • 快速删除
  • 避免浪费空间

然后你可能想要一个叫sparse array的东西。 稀疏数组不属于标准库,因此您必须使用std::mapstd::unordered_map模拟自己的数组。在稀疏数组中,只有非零元素占用集合中的空间。

ordered_map将具有O(1)查找,插入和删除,但不提供有序迭代。 map通常会有较慢的操作,但会提供有序的迭代。当我说std::map速度较慢时,我过于简单化,因为它取决于元素的数量和使用模式(一个话题可能已经在另一个问题中讨论过了)。

如果您必须绝对同时进行O(1)查找和有序迭代,则可以将mapordered_map结合使用并保持同步。此时,您需要考虑使用Boost.MultiIndex

这是一个粗略的草图,展示了如何实现自己的稀疏矢量类:

class SparseVector
{
public:
    int get(size_t index) const
    {
        auto kv = map_.find(index);
        return (kv == map_.end()) ? 0 : kv->second;
    }

    void put(size_t index, int value)
    {
        if (value == 0)
            map_.erase(index);
        else
            map_.emplace(index, value);
    }

    // etc...

private:
    std::unordered_map<size_t, int> map_;
};

线性代数库,例如EigenBoost.uBlas,已经为稀疏向量和矩阵提供了模板。