我仍在努力使用g ++内联汇编程序并试图了解如何使用它。
我从这里改编了一段代码:http://asm.sourceforge.net/articles/linasm.html(引自gcc信息文件中的“C表达式操作数的汇编指令”部分)
static inline uint32_t sum0() {
uint32_t foo = 1, bar=2;
uint32_t ret;
__asm__ __volatile__ (
"add %%ebx,%%eax"
: "=eax"(ret) // ouput
: "eax"(foo), "ebx"(bar) // input
: "eax" // modify
);
return ret;
}
我编译了禁用优化:
g++ -Og -O0 inline1.cpp -o test
反汇编的代码让我很困惑:
(gdb) disassemble sum0
Dump of assembler code for function sum0():
0x00000000000009de <+0>: push %rbp ;prologue...
0x00000000000009df <+1>: mov %rsp,%rbp ;prologue...
0x00000000000009e2 <+4>: movl $0x1,-0xc(%rbp) ;initialize foo
0x00000000000009e9 <+11>: movl $0x2,-0x8(%rbp) ;initialize bar
0x00000000000009f0 <+18>: mov -0xc(%rbp),%edx ;
0x00000000000009f3 <+21>: mov -0x8(%rbp),%ecx ;
0x00000000000009f6 <+24>: mov %edx,-0x14(%rbp) ; This is unexpected
0x00000000000009f9 <+27>: movd -0x14(%rbp),%xmm1 ; why moving variables
0x00000000000009fe <+32>: mov %ecx,-0x14(%rbp) ; to extended registers?
0x0000000000000a01 <+35>: movd -0x14(%rbp),%xmm2 ;
0x0000000000000a06 <+40>: add %ebx,%eax ; add (as expected)
0x0000000000000a08 <+42>: movd %xmm0,%edx ; copying the wrong result to ret
0x0000000000000a0c <+46>: mov %edx,-0x4(%rbp) ; " " " " " "
0x0000000000000a0f <+49>: mov -0x4(%rbp),%eax ; " " " " " "
0x0000000000000a12 <+52>: pop %rbp ;
0x0000000000000a13 <+53>: retq
End of assembler dump.
正如预期的那样,sum0()函数返回错误的值。
有什么想法?到底是怎么回事?如何做到对不对?
- 编辑 - 根据@MarcGlisse评论,我试过:
static inline uint32_t sum0() {
uint32_t foo = 1, bar=2;
uint32_t ret;
__asm__ __volatile__ (
"add %%ebx,%%eax"
: "=a"(ret) // ouput
: "a"(foo), "b"(bar) // input
: "eax" // modify
);
return ret;
}
似乎我一直关注的教程是误导性的。输出/输入字段中的“eax”并不表示寄存器本身,而是表示缩写表上的e,a,x缩写。
无论如何,我仍然没有做对。上面的代码导致编译错误:'asm'操作数有不可能的约束。
我不明白为什么。
答案 0 :(得分:2)
x86的扩展内联汇编约束列在official documentation中 complete documentation也值得一读。
如您所见,约束都是单个字母
约束“eax”fo foo
指定了三个约束:
一个
一个寄存器。X
任何SSE注册。电子
32位有符号整数常量,或......
由于您告诉GCC eax
被破坏,因此无法将输入操作数放在那里,而是选择xmm0
。
当编译器选择用于表示输入操作数的寄存器时,它不使用任何被破坏的寄存器
proper constraint is simply "a"。
您需要从clobbers中删除eax
(由于高位的归零应该是rax
)(并添加“cc”)。