不可变字典开销?

时间:2010-05-08 05:41:46

标签: f# dictionary immutability

在F#中使用不可变字典时,添加/删除条目会产生多少开销?

它会将整个存储桶视为不可变并克隆这些存储桶并仅重新创建项目已更改的存储桶吗?

即使是这种情况,似乎还有很多需要完成的复制才能创建新词典(?)

2 个答案:

答案 0 :(得分:6)

我查看了F#Map<K,V>类型的实现,我认为它是作为functional AVL tree实现的。它将值存储在树的内部节点以及叶子中,并且对于每个节点,它确保 | height(左) - height(右)| &lt; = 1

            A 
         /     \
        B       C
      /   \
     D     E

我认为平均和最坏情况的复杂性都是O(log(n))

  • 插入我们需要克隆从根到新插入元素的路径上的所有节点,树的高度最多为O(log(n))。在“回来的路上”,树可能需要重新平衡每个节点,但这也只是O(log(n))

  • 删除类似 - 我们找到该元素然后克隆从根到该元素的所有节点(在返回根目录的路上重新平衡节点)

请注意,在插入/删除时不需要重新平衡从根到当前节点的所有节点的其他数据结构在不可变场景中不会真正有用,因为您需要为整个节点创建新节点无论如何,路径。

答案 1 :(得分:1)

许多树结构都可以重复使用。我不知道算法的复杂程度,我猜平均只有像分摊的logN'浪费'......

为什么不尝试编写一个程序来衡量? (我们会看看今晚是否能有动力去尝试自己。)

修改

好的,这是我入侵的东西。我还没有决定这里是否有任何有用的数据。

open System

let rng = new Random()
let shuffle (array : _[]) =
    let n = array.Length
    for x in 1..n do
        let i = n-x
        let j = rng.Next(i+1)
        let tmp = array.[i]
        array.[i] <- array.[j]
        array.[j] <- tmp

let TryTwoToThe k =
    let N = pown 2 k

    GC.Collect()

    let a = Array.init N id

    let makeRandomTreeAndDiscard() =
        shuffle a
        let mutable m = Map.empty
        for i in 0..N-1 do
            m <- m.Add(i,i)

    for i in 1..20 do
        makeRandomTreeAndDiscard()
    for i in 1..20 do
        makeRandomTreeAndDiscard()
    for i in 1..20 do
        makeRandomTreeAndDiscard()

#time
// run these as separate interactions
printfn "16"
TryTwoToThe 16

printfn "17"
TryTwoToThe 17

printfn "18"
TryTwoToThe 18

当我在盒子上的FSI中运行时,我得到了

--> Timing now on

> 
16
Real: 00:00:08.079, CPU: 00:00:08.062, GC gen0: 677, gen1: 30, gen2: 1
> 
17
Real: 00:00:17.144, CPU: 00:00:17.218, GC gen0: 1482, gen1: 47, gen2: 4
> 
18
Real: 00:00:37.790, CPU: 00:00:38.421, GC gen0: 3400, gen1: 1059, gen2: 17

这表明内存可能是超线性缩放但不太严重。我假设gen0集合大致是重新平衡树的“浪费”的良好代理。但现在已经很晚了,所以我不确定我是否已经认识到这一点。 :)