我正在尝试查找SunCC编译器崩溃的原因。从SunCC 12.x早期开始就存在,并且在最新的SunCC 12.6中存在。尝试在x86系统上乘以多项式时会发生崩溃。以下代码是GCM算法的一部分:
$ cat test.cxx
# include <emmintrin.h>
# include <tmmintrin.h>
# include <wmmintrin.h>
__m128i GCM_Reduce_CLMUL(__m128i c0, __m128i c1, __m128i c2, const __m128i &r)
{
__m128i t = r;
c1 = _mm_xor_si128(c1, _mm_slli_si128(c0, 8));
t = _mm_clmulepi64_si128(c0, r, 0x10);
c1 = _mm_xor_si128(c1, t);
c0 = _mm_srli_si128(c0, 8);
c0 = _mm_xor_si128(c0, c1);
c0 = _mm_slli_epi64(c0, 1);
c0 = _mm_clmulepi64_si128(c0, r, 0x0);
c2 = _mm_xor_si128(c2, c0);
t = _mm_srli_si128(c1, 8);
c2 = _mm_xor_si128(c2, t);
c1 = _mm_unpacklo_epi64(c1, c2);
c1 = _mm_srli_epi64(c1, 63);
c2 = _mm_slli_epi64(c2, 1);
return _mm_xor_si128(c2, c1);
}
并且:
$ /opt/developerstudio12.6/bin/CC -DNDEBUG -g3 -xO3 -m64 -KPIC -template=no%extdef -xarch=aes -c test.cxx
lf 25 PCLMULP_Xx REG %x4 UND 0 REG %x4 REG %x0 UND 0 UND 0 UND 0 UND 0 UND 0 UND 0 off:0 uc:2 nxt: 29 bb: 3 FDI:F Ln:10 Ex:22
"test.cxx", [__1cQGCM_Reduce_CLMUL6FXXXrkX_X_]: assertion failed in function dump_asm_instruction() @ bfd_asm.c:2602
assert(nd_not_null_( disp.disp[0]) || (hf_dump_node(bfd_lf_node), 0))
CC: ube failed for test.cxx
由于bfd_asm.c:2602
,我无法找到有关崩溃的信息。我相信这与What causes SunCC crash in g3mangler.cc when using -std=XXX
?时发生的崩溃相同,但只是四处移动。
迄今为止,我们的策略是在等待修复时禁用代码路径。它似乎不会很快得到修复,因此我们想找到一种解决方法并重新启用代码。
是什么原因导致崩溃的,我该如何解决?
我认为这是MCVE,尽管它不是很有用:
$ cat test.cxx
# include <emmintrin.h>
# include <tmmintrin.h>
# include <wmmintrin.h>
__m128i GCM_Reduce_CLMUL(__m128i c0, __m128i c1, __m128i c2, const __m128i &r)
{
__m128i t = r;
t = _mm_clmulepi64_si128(c0, t, 0x10);
c0 = _mm_clmulepi64_si128(c0, t, 0x0);
return _mm_xor_si128(c1, c0);
}
jwalton@solaris2:~/cryptopp$ /opt/developerstudio12.6/bin/CC -DNDEBUG -g3 -xO3 -m64 -KPIC -template=no%extdef -xarch=aes -c test.cxx
lf 17 PCLMULP_Xx REG %x2 UND 0 REG %x2 REG %x0 UND 0 UND 0 UND 0 UND 0 UND 0 UND 0 off:0 uc:2 nxt: 21 bb: 3 FDI:F Ln:9 Ex:15
"test.cxx", [__1cQGCM_Reduce_CLMUL6FXXXrkX_X_]: assertion failed in function dump_asm_instruction() @ bfd_asm.c:2602
assert(nd_not_null_( disp.disp[0]) || (hf_dump_node(bfd_lf_node), 0))
CC: ube failed for test.cxx
答案 0 :(得分:1)
这是编译器中的错误。从内部表示转储中,我发现PCLMUL
指令的第二个输入操作数的类型错误。它必须是立即的,但在转储中是XMM。
可悲的是,这不太可能得到解决。我能想到的唯一解决方法是使用-xarch=avx
或更高版本,因为这将使用不同的指令表示,并且该错误不会出现。