我需要开发一个“天真”的数据库索引实现,以便在分布式环境中使用。我对这个问题几乎一无所知,而且时间有点紧张。
我很想听听有关这个主题的一些意见,例子和算法。 我希望能够对我需要实施的内容进行心理表达。
编辑:我指的是聚集索引
答案 0 :(得分:5)
基本上有两种主要类型的索引:
聚集(即数据是物理组织的,如果需要,您可以在每次插入时对其进行重新排序)
典型用例:物理组织通常与插入顺序相同,因此重新排序开销不是问题。这是例如顺序UID的情况(数据库上下文中所谓的“IDENTITY”字段)
聚簇索引的一个明显缺点是您的数据只能有一个这样的索引。
如果插入顺序正好是排序顺序,则执行Naive:使用List。
Unclustered(即你在数据中保留指针,就像在Hashtable中一样)
典型用例:群集不合适,因为它会导致很大的插入开销。
根据您的需要,您可能最终会使用这两个数据结构
提供了大量与索引相关的信息存储库here
答案 1 :(得分:1)
一个非常快速且易于实现,非常天真的索引实现,最适合任何具有本机associative array格式的语言,是一个哈希,其键是您所在列的现有值索引,其值是具有该值的行的行ID数组。