是否在C#中的堆中装箱了一个静态值类型字段?

时间:2014-09-09 10:02:14

标签: c# .net

出于好奇 - 请考虑以下示例:

public class A
{
    public static int Foo;
}

public class Program
{
    static void Main()
    {
        // The following variable will be allocated on the
        // stack and will directly hold 42 because it is a
        // value type.
        int foo = 42;

        // The following field resides on the (high frequency)
        // heap, but is it boxed because of being a value type?
        A.Foo = 42;
    }
}

我的问题如下:Foo字段框的值,因为它位于堆上?或者它是否在一个特殊的容器对象/内存部分中封装它就像实例值类型字段是堆上对象的一部分一样?

我认为它没有盒装,但我不确定,我找不到任何文件。

感谢您的帮助。

3 个答案:

答案 0 :(得分:6)

CLR 的限制是类的每个字段都需要具有相同的存储类型。只有实例成员才会在GC堆上结束。静态成员在加载程序堆中分配。或者在字段具有[ThreadStatic]属性时在线程本地存储中。这当然强制执行一个静态成员由该类对象的每个实例共享的契约。

非常简单地实现了btw,抖动分配存储并知道字段的地址。所以任何加载和存储都直接使用变量的地址。没有额外的指针取消引用,非常有效。

所以,不,根本不需要盒子,静态 int 只占用4个字节。

如果您想亲自查看,请使用Debug + Windows + Disassembly窗口。显示机器代码,您将直接使用变量的地址看到它。每次运行程序时,它都将是一个不同的地址,这是一种恶意软件对策。

答案 1 :(得分:2)

由于Sriram和Lee在问题的评论中给出了答案,但未提供答案,我将总结调查结果:

不,该值未加框。值类型可以驻留在堆上,只有在它们像参考类型一样使用时才会被装箱。

您还可以看到我的示例的IL代码中没有涉及装箱:

.method private hidebysig static void  Main() cil managed
{
  .entrypoint
  // Code size       12 (0xc)
  .maxstack  1
  .locals init ([0] int32 foo)
  IL_0000:  nop
  IL_0001:  ldc.i4.s   42
  IL_0003:  stloc.0
  IL_0004:  ldc.i4.s   42
  IL_0006:  stsfld     int32 StaticValueTypeFieldBoxing.A::Foo
  IL_000b:  ret
} // end of method Program::Main

答案 2 :(得分:1)

TL; DR:是的,但不是语义上的,并且仅适用于非内置值类型。

以下内容基于我对CLR应用程序内部工作的逆向工程。

提供的答案并不完全正确,实际上是很误导的。

这很有趣。这取决于。

int,float等类型(直接由VES支持)的内置类型原始存储在静态变量的地址中。

但是有趣的是,将非内置类型(如System.Decimal,System.DateTime和用户定义的值类型)装箱了。

但是有趣的是,他们实际上有点儿……有点被装箱了。想象一下:

public struct MyStruct
{
    public int A;
}

public static class Program
{
    public static MyStruct X;

    public static void Main()
    {
        Program.X.A = 1337;
        Program.DoIt();
    }

    public static void DoIt()
    {
        Program.PrintA(Program.X);
        Program.PrintType(Program.X);
    }

    private static void PrintType(object obj)
    {
        Console.WriteLine(obj.GetType().FullName);
    }

    public static void PrintA(MyStruct myStruct)
    {
        Console.WriteLine(myStruct.A);
    }
}

现在,这将按您期望的那样工作,将MyStruct装在PrintType中,而不装在PrintA中。

但是,Program.X实际上并不像实例变量或局部变量中那样直接包含MyStruct实例。相反,它在堆上包含对它的引用,在该堆中实例作为对象存在,带有对象标头和所有对象。

如前所述,这不适用于内置类型。因此,如果您有一个包含int的静态变量,则该静态变量将占用4个字节。但是,如果您具有用户定义类型的静态变量,例如。 struct IntWrapper{public int A;},则静态变量将在32位进程中占用4个字节,在64位进程中占用8个字节,以存储盒装版本的IntWrapper结构的地址,在其中它占用8个字节。一个32位进程和一个64位进程中的12个字节(对象标头指针为4/8字节,int为4字节),而忽略了任何可能的填充。

但是,从语义上讲,它的工作方式与您期望的一样。调用PrintA(Program.X)时,程序将在Program.X指向的对象中复制结构部分(对象标头之后的数据)并将其传递给PrintA。

调用PrintType(Program.X)时,确实将实例装箱。该代码创建一个带有对象头的新MyStruct对象,然后将Program.X引用的对象的A字段复制到新创建的对象中,然后将该对象传递给PrintType。

总而言之,Program.X包含装箱的MyStruct的地址(如果我们将装箱定义为将值类型转换为引用类型),但仍会将该对象装箱(或克隆),就好像它是值类型一样,因此语义保持不变,就像它作为值类型直接存储在静态变量中一样。

就像我说的那样,我不确定他们为什么这样做,但是确实如此。

我已经在上面包含了JIT的C#代码反汇编并对其进行了注释。 请注意,我在反汇编中提出了所有名称。

有关调用的注释:对托管方法的所有调用都是通过指针进行的。在第一次调用时,指针指向负责JIT编译方法的代码。 JIT编译后,该指针将替换为JIT编译后的代码的地址,因此任何后续调用都很快。

Program.Main:
    MOV     EAX, DWORD PTR DS:[<Program.X>]                 ; Move the address stored in static variable Program.X into register EAX.
    MOV     DWORD PTR DS:[EAX + 4], 539h                    ; Set field at offset 4 (Offset 0 is the object header pointer) to 1337.
    CALL    DWORD PTR DS:[<Program.DoIt Ptr>]               ; Call Program.DoIt.
RET                                                         ; Return and exit the program.

Program.DoIt:
    PUSH    EBP                                             ; Function prologue.
    MOV     EBP, ESP                                        ; Function prologue.
    MOV     EAX, DWORD PTR DS:[<Program.X>]                 ; Move the address stored in static variable Program.X into register EAX.
    MOV     ECX, DWORD PTR DS:[EAX + 4]                     ; Copy the struct part (the dword after the object header pointer) into ECX (first argument (this)), essentially an unboxing.
    CALL    DWORD PTR DS:[<Program.PrintA Ptr>]             ; Call Program.PrintA.
    ; Here, the MyStruct stored in the static value is cloned to maintain value semantics (Essentially boxing the already boxed MyStruct instance).
    MOV     ECX, <MyStructObjectHeader>                     ; Boxing for PrintType: Copy the address of the object header for MyStruct into ECX (First argument).
    CALL    <CreateObject>                                  ; Boxing for PrintType: Create a new object (reference type) for MyStruct.
    MOV     ECX, EAX                                        ; Copy the address of the new object into ECX (first argument for Program.PrintType).
    MOV     EAX, DWORD PTR DS:[<Program.X>]                 ; Boxing for PrintType: Move the address stored in static variable Program.X into register EAX.
    MOV     EAX, DWORD PTR DS:[EAX + 4]                     ; Boxing for PrintType: Get value of MyStruct.A from the object stored in Program.X (MyStruct.A is at offset 4, since the object header is at offset 0).
    MOV     DWORD PTR DS:[ECX + 4], EAX                     ; Boxing for PrintType: Store that value in the newly created object (MyStruct.A is at offset 4, since the object header is at offset 0).
    CALL    DWORD PTR DS:[<Program.PrintType Ptr>]          ; Call Program.PrintType.
    POP     EBP                                             ; Function epilogue.
RET                                                         ; Return to caller.

Program.PrintA:
    PUSH    EAX                                             ; Allocate local variable.
    MOV     DWORD PTR SS:[ESP], ECX                         ; Store argument 1 (the MyStruct) in the local variable.
    MOV     ECX, DWORD PTR SS:[ESP]                         ; Copy the MyStruct instance from the local variable into ECX (first argument to WriteLine).
    CALL    <mscorlib.ni.System.Console.WriteLine(object)>  ; Call WriteLine(object) overload.
    POP     ECX                                             ; Deallocate local variable.
RET                                                         ; Return to caller.

Program.PrintType:
    PUSH    EBP                                             ; Function prologue.
    MOV     EBP, ESP                                        ; Function prologue.
    CMP     DWORD PTR DS:[ECX], ECX                         ; Cause an access violation if 'this' is null, so the CLR can throw a null reference exception.
    CALL    <GetType>                                       ; GetType.
    MOV     ECX, EAX                                        ; Copy the returned System.Type object address into ECX (first argument).
    MOV     EAX, DWORD PTR DS:[ECX]                         ; Dereference object header pointer.
    MOV     EAX, DWORD PTR DS:[EAX + 38h]                   ; Retrieve virtual function table.
    CALL    DWORD PTR DS:[EAX + 10h]                        ; Call virtual function at offset 10h (get_FullName method).
    MOV     ECX, EAX                                        ; Copy returned System.String into ECX (first argument).
    CALL    <mscorlib.ni.System.Console.WriteLine(int)>     ; Call WriteLine.
    POP     EBP                                             ; Function epilogue.
RET                                                         ; Return to caller.

这里比较了long类型和其他值类型等内置类型之间的区别。

public static class Program
{
    public static long X;

    public static void Main()
    {
        Program.X = 1234567887654321;
    }
}

编译为:

Program.Main:
    PUSH    EBP                                                 ; Function prologue.
    MOV     EBP, ESP                                            ; Function prologue.
    MOV     DWORD PTR DS:[DD4408], 3C650DB1                     ; Store low DWORD of 1234567887654321.
    MOV     DWORD PTR DS:[DD440C], 462D5                        ; Store high DWORD of 1234567887654321.
    POP     EBP                                                 ; Function epilogue.
RET                                                             ; Return.

在此示例中,MyStruct包装了一个长条。

public static class Program
{
    public static MyStruct X;

    public static void Main()
    {
        Program.X.A = 1234567887654321;
    }
}

编译为:

Program.Main:
    PUSH    EBP                                                 ; Function prologue.
    MOV     EBP, ESP                                            ; Function prologue.
    MOV     EAX, DWORD PTR DS:[3BD354C]                         ; Retrieve the address of the MyStruct object stored at the address where Program.X resides.
    MOV     DWORD PTR DS:[EAX + 4], 3C650DB1                    ; Store low DWORD of 1234567887654321 (The long begins at offset 4 since offset 0 is the object header pointer).
    MOV     DWORD PTR DS:[EAX + 8], 462D5                       ; Store high DWORD of 1234567887654321 (High DWORD of course is offset 4 more from the low DWORD).
    POP     EBP                                                 ; Function epilogue.
RET                                                             ; Return.

附带说明:这些结构对象是为该类的所有值类型静态变量分配的,这是第一次调用访问该类中任何静态变量的方法时。

也许这就是他们这样做的原因。节省内存。如果静态类中有很多结构,但是您没有在使用它们的类上调用任何方法,则可以使用更少的内存。如果将它们内联到静态类中,那么即使您的程序从不访问它们,每个结构也会无故占用它们在内存中的大小。通过在第一次访问它们时将它们作为对象分配在堆上,则仅在访问它们时占用它们在内存中的大小(对象头的+指针),而在不访问它们时每个变量最多占用8个字节。这也使库更小。但这只是我的猜测,他们为什么会这样做。