试图从g ++中理解简单的反汇编代码

时间:2017-01-27 10:30:23

标签: c++ gcc assembly g++ disassembly

我仍在努力使用g ++内联汇编程序并试图了解如何使用它。

我从这里改编了一段代码:http://asm.sourceforge.net/articles/linasm.html(引自gcc信息文件中的“C表达式操作数的汇编指令”部分)

static inline uint32_t sum0() {
   uint32_t foo = 1, bar=2;
   uint32_t ret;
   __asm__ __volatile__ (
      "add  %%ebx,%%eax" 
         : "=eax"(ret)              // ouput
         : "eax"(foo), "ebx"(bar)   // input
         : "eax"                    // modify
   );
   return ret;
}

我编译了禁用优化:

g++ -Og -O0 inline1.cpp -o test

反汇编的代码让我很困惑:

(gdb) disassemble sum0
Dump of assembler code for function sum0():
   0x00000000000009de <+0>:   push   %rbp                  ;prologue...
   0x00000000000009df <+1>:   mov    %rsp,%rbp             ;prologue...
   0x00000000000009e2 <+4>:   movl   $0x1,-0xc(%rbp)       ;initialize foo
   0x00000000000009e9 <+11>:  movl   $0x2,-0x8(%rbp)       ;initialize bar
   0x00000000000009f0 <+18>:  mov    -0xc(%rbp),%edx       ;
   0x00000000000009f3 <+21>:  mov    -0x8(%rbp),%ecx       ;
   0x00000000000009f6 <+24>:  mov    %edx,-0x14(%rbp)      ; This is unexpected
   0x00000000000009f9 <+27>:  movd   -0x14(%rbp),%xmm1     ; why moving variables
   0x00000000000009fe <+32>:  mov    %ecx,-0x14(%rbp)      ; to extended registers?
   0x0000000000000a01 <+35>:  movd   -0x14(%rbp),%xmm2     ;
   0x0000000000000a06 <+40>:  add    %ebx,%eax             ; add (as expected)
   0x0000000000000a08 <+42>:  movd   %xmm0,%edx            ; copying the wrong result to ret
   0x0000000000000a0c <+46>:  mov    %edx,-0x4(%rbp)       ;    "     "    "     "     "  "
   0x0000000000000a0f <+49>:  mov    -0x4(%rbp),%eax       ;    "     "    "     "     "  "
   0x0000000000000a12 <+52>:  pop    %rbp                  ;
   0x0000000000000a13 <+53>:  retq   
End of assembler dump.

正如预期的那样,sum0()函数返回错误的值。

有什么想法?到底是怎么回事?如何做到对不对?

- 编辑 - 根据@MarcGlisse评论,我试过:

static inline uint32_t sum0() {
   uint32_t foo = 1, bar=2;
   uint32_t ret;
   __asm__ __volatile__ (
      "add  %%ebx,%%eax" 
         : "=a"(ret)             // ouput
         : "a"(foo), "b"(bar)     // input
         : "eax"                 // modify
   );
   return ret;
}

似乎我一直关注的教程是误导性的。输出/输入字段中的“eax”并不表示寄存器本身,而是表示缩写表上的e,a,x缩写。

无论如何,我仍然没有做对。上面的代码导致编译错误:'asm'操作数有不可能的约束。

我不明白为什么。

1 个答案:

答案 0 :(得分:2)

x86的扩展内联汇编约束列在official documentationcomplete documentation也值得一读。

如您所见,约束都是单个字母 约束“eax”fo foo指定了三个约束:

  

一个
  一个寄存器。

     

X
  任何SSE注册。

     

电子
  32位有符号整数常量,或......

由于您告诉GCC eax被破坏,因此无法将输入操作数放在那里,而是选择xmm0

  

当编译器选择用于表示输入操作数的寄存器时,它不使用任何被破坏的寄存器

proper constraint is simply "a"
您需要从clobbers中删除eax(由于高位的归零应该是rax)(并添加“cc”)。