你们中的任何人都可以告诉我词典结构的查找方法背后是什么 。我是说它是如何实现的?给定一个键,我们在字典中找到值。
1)我们知道并且数组查找是O(1)操作。那么字典怎么样?
2)如果我存储两个都是整数的键值对,如果有大量的这样的数据和空间是我最关心的问题吗?数组还是字典? 例如,我可以分配一个固定大小的数组。但是键值对可能不占用整个阵列。它的大小可能是阵列的一半。但是阵列分配应该是最大的,因为我不知道某个键是否会出现。 让我澄清一下,让我们有关键值对(10,1),(20,2),(30,3)。因此,如果我使用数组,那么我必须将其大小声明为[30] [2],尽管它只占用3个条目。所以,在这种情况下,字典会更好。不是30可以是百万。那么其他条目会占用数组中的内存吗?
答案 0 :(得分:2)
字典通常以两种方式实现,即哈希映射或二叉树。
1:如果字典是二叉树,那么搜索时间是二进制搜索,因此是O(log n)。
如果字典是哈希映射,则搜索时间为O(1)。 (对于具有相同哈希值的密钥,可能会增加到O(m))
2:你是对的,在这种稀疏数据集的情况下,字典将更好地利用空间。字典搜索的额外时间成本相对较低。
使用字典可以进一步改进使用字典搜索(如果平均情况是哈希映射中不存在的对象)。
答案 1 :(得分:2)
术语dictionary
非常通用,可以指任何类型的数据结构。你也没有说它是有序字典还是无序字典。有各种各样的二叉搜索树,n-ary树,哈希表,跳过列表等。
就阵列而言,直平阵列在人口稀少时会浪费空间。但是,您可以实现多级数组。前几个级别是目录,只有叶级别有小数组。
虚拟内存页表通常以这种方式实现。
所以会发生的是像(hex)[0x123456]这样的数组索引可能会被位掩码操作分解为[0x12] [0x34] [0x56]。选择顶级目录,这是一个指向中间目录的指针数组,其中包含指向小表的指针数组。 (当然,实际上,代码必须走水平并注意丢失的目录和表而不是直接索引!这就是重点:不要将整个树实例化。)
不久前,我以这种方式在正则表达式引擎中实现了Unicode字符集,使用了几种不同深度的结构,适用于不同情况。
当然,这与您的常规new int[foo]
C ++数组无关!但当然可以隐藏在看起来像数组的类后面。