请考虑以下代码:
class B: public A {
public:
B(int a1,int a2,int a3) : A(...AUTOARG...) {
.. Do Some More Init for B ...
}
}
调试模式的结果是:100,100,100,100,100。 但在发布模式下,它是:100,100,100,100,0。
发生了什么事?
使用.NET framework 4.7.1和.NET Core 2.0.0进行了测试。
答案 0 :(得分:69)
这似乎是一个JIT错误;我测试过:
// ... existing code unchanged
for (int i = 0; i < N - Old.Length; i++)
{
// Console.WriteLine(i); // <== comment/uncomment this line
dd[i] = d;
}
并添加Console.WriteLine(i)
修复了它。唯一的IL变化是:
// ...
L_0040: ldc.i4.0
L_0041: stloc.3
L_0042: br.s L_004d
L_0044: ldarg.0
L_0045: ldind.ref
L_0046: ldloc.3
L_0047: ldloc.1
L_0048: stelem.r8
L_0049: ldloc.3
L_004a: ldc.i4.1
L_004b: add
L_004c: stloc.3
L_004d: ldloc.3
L_004e: ldarg.1
L_004f: ldloc.0
L_0050: ldlen
L_0051: conv.i4
L_0052: sub
L_0053: blt.s L_0044
L_0055: ret
VS
// ...
L_0040: ldc.i4.0
L_0041: stloc.3
L_0042: br.s L_0053
L_0044: ldloc.3
L_0045: call void [System.Console]System.Console::WriteLine(int32)
L_004a: ldarg.0
L_004b: ldind.ref
L_004c: ldloc.3
L_004d: ldloc.1
L_004e: stelem.r8
L_004f: ldloc.3
L_0050: ldc.i4.1
L_0051: add
L_0052: stloc.3
L_0053: ldloc.3
L_0054: ldarg.1
L_0055: ldloc.0
L_0056: ldlen
L_0057: conv.i4
L_0058: sub
L_0059: blt.s L_0044
L_005b: ret
看起来完全正确(唯一的区别是额外的ldloc.3
和call void [System.Console]System.Console::WriteLine(int32)
,以及br.s
的不同但等效的目标。
我怀疑它需要一个JIT修复。
环境:
Environment.Version
:4.0.30319.42000 <TargetFramework>netcoreapp2.0</TargetFramework>
dotnet --version
:2.1.1 答案 1 :(得分:6)
确实是装配错误。 x64,.net 4.7.1,发布版本。
拆卸:
for(int i = 0; i < N - Old.Length; i++)
00007FF942690ADD xor eax,eax
for(int i = 0; i < N - Old.Length; i++)
00007FF942690ADF mov ebx,esi
00007FF942690AE1 sub ebx,ebp
00007FF942690AE3 test ebx,ebx
00007FF942690AE5 jle 00007FF942690AFF
dd[i] = d;
00007FF942690AE7 mov rdx,qword ptr [rdi]
00007FF942690AEA cmp eax,dword ptr [rdx+8]
00007FF942690AED jae 00007FF942690B11
00007FF942690AEF movsxd rcx,eax
00007FF942690AF2 vmovsd qword ptr [rdx+rcx*8+10h],xmm6
for(int i = 0; i < N - Old.Length; i++)
00007FF942690AF9 inc eax
00007FF942690AFB cmp ebx,eax
00007FF942690AFD jg 00007FF942690AE7
00007FF942690AFF vmovaps xmm6,xmmword ptr [rsp+20h]
00007FF942690B06 add rsp,30h
00007FF942690B0A pop rbx
00007FF942690B0B pop rbp
00007FF942690B0C pop rsi
00007FF942690B0D pop rdi
00007FF942690B0E pop r14
00007FF942690B10 ret
问题在地址00007FF942690AFD,即00007FF942690AE7。如果ebx(包含4,循环结束值)比eax(jg)更大(jg),则值会跳回。当它4当然失败时,因此它不会写入数组中的最后一个元素。
它失败了,因为它包含了我的寄存器值(eax,在0x00007FF942690AF9),然后用4来检查它,但它仍然必须写入该值。它有点难以确定问题的确切位置,因为它看起来可能是(N-Old.Length)优化的结果,因为调试版本包含该代码,但发布版本预先计算那。因此,jit人员可以修复;)