离散匿名方法共享一个类?

时间:2010-10-07 19:20:04

标签: c# delegates anonymous-methods

我在here的Eric Lippert的Ref<T>课上玩了一些。我在IL中注意到,看起来两个匿名方法都使用相同的生成类,即使这意味着类有一个额外的变量。

虽然只使用一个新的类定义似乎有点合理,但令我觉得奇怪的是只创建了<>c__DisplayClass2的一个实例。这似乎意味着Ref<T>的两个实例都引用相同的<>c__DisplayClass2这并不意味着在收集y之前无法收集vart1,这可能会在以后发生比joik返回后?毕竟,不能保证一些白痴不会写一个函数(直接在IL中)直接访问y通过vart1 aftrer joik返回。也许这甚至可以用反射而不是疯狂的IL来完成。

sealed class Ref<T>
{
    public delegate T Func<T>();
    private readonly Func<T> getter;
    public Ref(Func<T> getter)
    {
        this.getter = getter;
    }
    public T Value { get { return getter(); } }
}

static Ref<int> joik()
{
    int[] y = new int[50000];
    int x = 5;
    Ref<int> vart1 = new Ref<int>(delegate() { return x; });
    Ref<int[]> vart2 = new Ref<int[]>(delegate() { return y; });
    return vart1;
}

运行IL DASM确认vart1vart2都使用<>__DisplayClass2,其中包含x和y的公共字段。约翰的IL:

.method private hidebysig static class Program/Ref`1<int32> 
        joik() cil managed
{
  // Code size       72 (0x48)
  .maxstack  3
  .locals init ([0] class Program/Ref`1<int32> vart1,
           [1] class Program/Ref`1<int32[]> vart2,
           [2] class Program/'<>c__DisplayClass2' '<>8__locals3',
           [3] class Program/Ref`1<int32> CS$1$0000)
  IL_0000:  newobj     instance void Program/'<>c__DisplayClass2'::.ctor()
  IL_0005:  stloc.2
  IL_0006:  nop
  IL_0007:  ldloc.2
  IL_0008:  ldc.i4     0xc350
  IL_000d:  newarr     [mscorlib]System.Int32
  IL_0012:  stfld      int32[] Program/'<>c__DisplayClass2'::y
  IL_0017:  ldloc.2
  IL_0018:  ldc.i4.5
  IL_0019:  stfld      int32 Program/'<>c__DisplayClass2'::x
  IL_001e:  ldloc.2
  IL_001f:  ldftn      instance int32 Program/'<>c__DisplayClass2'::'<joik>b__0'()
  IL_0025:  newobj     instance void class Program/Ref`1/Func`1<int32,int32>::.ctor(object,
                                                                                    native int)
  IL_002a:  newobj     instance void class Program/Ref`1<int32>::.ctor(class Program/Ref`1/Func`1<!0,!0>)
  IL_002f:  stloc.0
  IL_0030:  ldloc.2
  IL_0031:  ldftn      instance int32[] Program/'<>c__DisplayClass2'::'<joik>b__1'()
  IL_0037:  newobj     instance void class Program/Ref`1/Func`1<int32[],int32[]>::.ctor(object,
                                                                                        native int)
  IL_003c:  newobj     instance void class Program/Ref`1<int32[]>::.ctor(class Program/Ref`1/Func`1<!0,!0>)
  IL_0041:  stloc.1
  IL_0042:  ldloc.0
  IL_0043:  stloc.3
  IL_0044:  br.s       IL_0046
  IL_0046:  ldloc.3
  IL_0047:  ret
} // end of method Program::joik

2 个答案:

答案 0 :(得分:13)

是的,匿名方法的MS实现有效地为每个范围创建了一个隐藏类,它需要从中捕获变量,并从该范围捕获所有相关变量。我相信这是为了简单起见,但确实可以不必要地增加某些对象的生命周期。

对于捕获其实际感兴趣的变量的每个匿名方法会更优雅。但是,这可能会使生活相当更复杂...如果一个匿名方法捕获xy,一个捕获x,一个捕获y,您需要三个类:一个用于捕获x,一个用于捕获y捕获{{1}},一个用于组合两个(但只有两个变量)。棘手的一点是,对于任何单个变量实例化,该变量需要只存在于一个位置,以便引用它的所有内容都能看到相同的值,无论它是什么变化。

这并没有违反规范,但它可能被认为是不幸的 - 我不知道它是否真的在现实生活中被咬过,但它肯定是可能的。

好消息是,如果C#团队决定改进这一点,他们应该能够以完全向后兼容的方式这样做,除非有些muppets 依赖一生不必要地延长。< / p>

答案 1 :(得分:9)

乔恩当然是对的。这通常导致的问题是:

void M()
{
    Expensive e = GetExpensive();
    Cheap c = GetCheap();
    D longLife = ()=>...c...;
    D shortLife = ()=>...e...;
    ...
}

所以我们有一个昂贵的资源,其寿命现在取决于longLife的生命周期,即使shortLife是早期收集的。

这很不幸,但很常见。 JScript和VB中闭包的实现也存在同样的问题。

我想在假设的未来版本的C#中解决它,但我不保证。显而易见的方法是根据捕获的lambdas来识别封闭变量的等价类,并为每个等价类生成一个闭包类,而不是单个闭包类。

我们可以通过分析写入的封闭变量来做些事情。正如Jon指出的那样,我们目前受限于捕获变量而不是值。如果我们在创建闭包之后识别出从未写入的变量,那么我们可以在代码生成策略中更灵活,并将它们变为封闭值而不是封闭变量。