涉及F#中嵌套序列的开销

时间:2013-08-12 15:03:28

标签: performance f# lazy-evaluation

我需要针对xml结构进行过多的模式匹配,所以我声明了一个表示xml节点的类型。 xml是一个多树,我需要以某种方式迭代节点。为了使树可枚举,我使用嵌套序列推导。我的XML永远不会太大,所以简单性在我的情况下胜过性能,但是下面的代码对于更大的输入有点危险,或者可以保持原样。

type ElementInfo = { Tag : string; Attributes : Map<string, string> }
type Contents = 
    | Nothing
    | String of string
    | Elements of Node list
and Node =
    | Element of ElementInfo * Contents
    | Comment of string
    member node.PreOrder = 
        seq {
            match node with
            | Element (_, Elements children) as parent -> yield parent; yield! children |> Seq.collect (fun child -> child.PreOrder)
            | singleNode -> yield singleNode
        }

1 个答案:

答案 0 :(得分:5)

我认为对Seq.collect的调用可能会导致它每次调用生成IEnumerable,因此我将其替换为for循环并生成相同的输出(通过ILSpy)。

这让我好奇,所以我反编译了一个更简单的序列表达式,我希望它会“扁平化”。

let rec infSeq n =
  seq {
    yield n
    yield! infSeq (n+1)
  }

生成序列中下一个元素的代码反编译为:

public override int GenerateNext(ref IEnumerable<int> next)
{
    switch (this.pc)
    {
    case 1:
        this.pc = 2;
        next = Test.infSeq(this.n + 1);
        return 2;
    case 2:
        this.pc = 3;
        break;
    case 3:
        break;
    default:
        this.pc = 1;
        this.current = this.n;
        return 1;
    }
    this.current = 0;
    return 0;
}

正如您所看到的,它以递归方式调用自身,每次都生成一个新的IEnumerable。在FSI进行快速测试

infSeq 0 |> Seq.take 10000000 |> Seq.length

你可以看到有很多GC:

> Real: 00:00:01.759, CPU: 00:00:01.762, GC gen0: 108, gen1: 107, gen2: 1

与C#版本相比

public static IEnumerable<int> InfSeq(int n) {
    while (true) yield return n++;
}
在FSI中

> Real: 00:00:00.991, CPU: 00:00:00.998, GC gen0: 0, gen1: 0, gen2: 0

它更快并且使用恒定内存(没有额外的IEnumerable s)。

我认为F#会在尾部位置为IEnumerable生成一个yield!,但显然不会。

修改

spec confirms{| yield! expr |}详细说明为expr,即子序列(递归或其他)未合并为单个IEnumerable