这是我经常遇到的编程问题,并且想知道是否存在数据结构,无论是在C ++ STL还是我自己实现的,都提供随机和顺序访问。
我可能需要这个的一个例子:
假设有n种类型的项目(例如,n = 1000000),并且每种类型的项目都有固定数量(例如,0或10)
我将这些项目存储到一个数组中,其中数组索引表示项目的类型,值表示该类型的项目有多少
现在,我有一个迭代所有现有项目的算法。要获得这些项目,当所有条目都为0时迭代整个数组是非常浪费的,除了数组[99999]和数组[999999]。
通常,我通过使用链表来解决这个问题,该链表保存了所有非零数组条目的索引。我以这种方式实现标准操作:
插入(int t):
1)如果Array [t] == 0,LinkedList.push_back(t);
2)Array [t] ++;
删除(int t):
1)如果Array [t] == 1,则从LinkedList中找到并删除t;
2)数组[t] - ;
如果我想要删除操作的O(1)复杂性,我将数组存储容器而不是整数。每个容器都包含一个整数和指向LinkedList各自元素的指针,因此我不必搜索列表。
我很想知道是否存在正式化/改进此方法的数据结构,或者是否有更好的方法来完成此操作。
答案 0 :(得分:6)
考虑到以下要求:
然后你可能想要一个叫sparse array的东西。 稀疏数组不属于标准库,因此您必须使用std::map
或std::unordered_map
模拟自己的数组。在稀疏数组中,只有非零元素占用集合中的空间。
ordered_map
将具有O(1)查找,插入和删除,但不提供有序迭代。 map
通常会有较慢的操作,但会提供有序的迭代。当我说std::map
速度较慢时,我过于简单化,因为它取决于元素的数量和使用模式(一个话题可能已经在另一个问题中讨论过了)。
如果您必须绝对同时进行O(1)查找和有序迭代,则可以将map
和ordered_map
结合使用并保持同步。此时,您需要考虑使用Boost.MultiIndex。
这是一个粗略的草图,展示了如何实现自己的稀疏矢量类:
class SparseVector
{
public:
int get(size_t index) const
{
auto kv = map_.find(index);
return (kv == map_.end()) ? 0 : kv->second;
}
void put(size_t index, int value)
{
if (value == 0)
map_.erase(index);
else
map_.emplace(index, value);
}
// etc...
private:
std::unordered_map<size_t, int> map_;
};
线性代数库,例如Eigen或Boost.uBlas,已经为稀疏向量和矩阵提供了模板。