我应该使用哪些AVX寄存器来避免3字节VEX前缀?

时间:2013-09-25 22:22:25

标签: assembly 64-bit des avx yasm

我目前正在为x64实现Bitslice DES,我想知道如何使用以下AVX指令尽可能地避免使用3字节VEX前缀:

vpor
vpxor
vpand
vpandn

我被告知我应尽可能使用2字节VEX前缀而不是3字节前缀,以使代码更小更快,但我不知道具体如何操作。我读到某处我应该使用xmm [0-7]而不是xmm [89]和xmm1 [0-5],但我不知道哪些操作数组合会给我2字节的VEX前缀而不是3-字节的。这些指令与2或3个操作数一起使用,如以下代码段所示:

%macro sbox1 4
vmovdqa xmm7,  xmm4
vpandn  xmm4,  xmm0
vpor    xmm10, xmm5,  xmm2
vpxor   xmm13, xmm2,  xmm0
vpxor   xmm11, xmm5,  xmm7
vpxor   xmm14, xmm4,  xmm3
vpandn  xmm12, xmm13, xmm11
vpand   xmm13, xmm10
vpxor   xmm15, xmm11, xmm2
vpxor   xmm8,  xmm13, xmm3
vpandn  xmm9,  xmm14, xmm8
vpor    xmm13, xmm5
vpor    xmm5,  xmm0
vpandn  xmm8,  xmm7
vpandn  xmm15, xmm14
vpxor   xmm13, xmm15
vpor    xmm6,  xmm5,  xmm13
vpandn  xmm5,  xmm3
vpandn  xmm15, xmm9,  xmm13
vmovdqa xmm3,  xmm8 
vpxor   xmm8,  xmm6
vpxor   xmm5,  xmm3
vpand   xmm13, xmm10
vpandn  xmm4,  xmm2
vpxor   xmm2,  xmm6,  xmm14
vpxor   xmm6,  xmm10
vpandn  xmm4,  xmm2
vpxor   xmm2,  xmm4,  pnot
vpxor   xmm4,  xmm11
vpxor   xmm13, xmm2
vpor    xmm4,  xmm3
vpandn  xmm2,  xmm1,  xmm8
vpor    xmm14, xmm7
vpxor   xmm4,  xmm10
vpor    xmm9,  xmm1
vpxor   xmm2,  xmm13
vpxor   xmm4,  xmm0
vpxor   xmm13, xmm4
vpxor   xmm9,  xmm13
vpor    xmm5,  xmm12
vpxor   xmm9,  %1

vmovdqa %1,    xmm9
vpor    xmm6,  xmm5
vpor    xmm13, xmm11
vpxor   xmm6,  xmm4
vpor    xmm0,  xmm1,  xmm15
vpxor   xmm13, xmm6
vpxor   xmm2,  %3
vmovdqa %3,    xmm2
vpxor   xmm13, %2
vpand   xmm4,  xmm15
vpandn  xmm6,  xmm14
vpxor   xmm13, xmm0
vmovdqa %2,    xmm13
vpxor   xmm4,  xmm6
vpor    xmm4,  xmm1
vpxor   xmm4,  xmm5
vpxor   xmm4,  %4
vmovdqa %4,    xmm4
%endmacro

2 个答案:

答案 0 :(得分:2)

你应该坚持注册xmm0...xmm7。这也适用于通用寄存器,涉及eax,ebx...ebp的指令编码大多数时间比使用r8d...r15d的指令短一个字节。

答案 1 :(得分:2)

事实证明,我只需要使用xmm0 ... xmm7 作为最后一个操作数,以使用2字节VEX前缀编码指令。