GCC内联 - 推送地址,而不是它的堆栈值

时间:2014-09-05 19:04:31

标签: c gcc inline-assembly att

我正在尝试使用GCC的内联汇编程序(我使用的是MinGW,我的操作系统是Win7)。 现在我只能使用一些基本的C stdlib函数来工作。我通常熟悉英特尔语法,但对AT& T来说是新手。

以下代码效果很好:

char localmsg[] = "my local message";
asm("leal %0, %%eax" : "=m" (localmsg));
asm("push %eax");
asm("call %0" : : "m" (puts));
asm("add $4,%esp");

然而,LEA似乎是多余的,因为我可以直接将值推到堆栈上。好吧,由于我认为是AT& T的特点,这样做:

asm("push %0" : "=m" (localmsg));

将在最终的可执行文件中生成以下汇编代码:

PUSH DWORD PTR SS:[ESP+1F]

因此,不是将地址推送到我的字符串,而是推送其内容,因为"指针"以C语言被解除引用"这显然会导致崩溃。

我认为这只是GAS的正常行为,但我无法找到有关如何克服这一点的任何信息。我很感激任何帮助。

P.S。我知道对于那些有经验的人来说,这是一个微不足道的问题。我希望被投票,但我只花了45分钟寻找解决方案而一无所获。

P.P.S。我意识到执行此操作的正确方法是在C代码中调用puts( )。这纯粹是出于教育/实验的原因。

1 个答案:

答案 0 :(得分:3)

虽然内联asm总是有点棘手,但从它调用函数特别具有挑战性。不是我建议的#34;进入已知的内联asm"项目。如果您还没有,我建议您查看最新的内联asm docs。为了解释内联asm是如何工作的,我们已经做了很多工作。

那就是说,这里有一些想法:

1)使用像这样的多个asm语句是个坏主意。正如docs所说:不要指望asm语句序列在编译后保持完全连续。如果某些指令需要在输出中保持连续,请将它们放在单个多指令asm语句中。

2)直接修改寄存器(就像你正在使用eax)而不让gcc知道你这样做也是一个坏主意。您应该使用寄存器约束(因此gcc可以选择自己的寄存器)或者使用clobbers来让gcc知道你正在踩它们。

3)当调用函数(如puts)时,虽然某些寄存器必须在返回之前恢复其值,但是某些寄存器可以被调用函数视为临时寄存器(即在返回之前修改并且不恢复)。正如我在#2中提到的,让你的asm修改寄存器而不通知gcc是一个非常糟糕的主意。如果您知道要调用的函数的ABI,则可以将其临时寄存器添加到asm的clobber列表中。

4)虽然在这个具体的例子中你使用一个常量字符串,但作为一般规则,当将asm指针传递给字符串,结构,数组等时,你可能需要" memory" clobber确保在开始执行asm之前执行任何挂起的内存写入。

5)实际上,lea正在做一些非常重要的事情。 esp的值在编译时是未知的,因此它不像您可以执行push $12345。有人需要计算(esp + localmsg的偏移量)才能将其推入堆栈。另请参阅下面的第二个示例。

6)如果您更喜欢英特尔格式(以及正确思考的人不会?),您可以使用-masm = intel。

鉴于这一切,我在这段代码中的第一次切割看起来像这样。请注意,这不会破坏'刮擦寄存器。那是一个练习...

#include <stdio.h>

int main()
{
  const char localmsg[] = "my local message";

  int result;

  /* Use 'volatile' since 'result' is usually not going to get used,
     which might tempt gcc to discard this asm statement as unneeded. */

  asm volatile ("push %[msg] \n\t"   /* Push the address of the string. */
                "call %[puts] \n \t" /* Call the print function. */
                "add $4,%%esp"       /* Clean up the stack. */

                : "=a" (result) /* The result code from puts. */
                : [puts] "m" (puts), [msg] "r" (localmsg)
                : "memory", "esp");

   printf("%d\n", result);
}

确实,这并不会因#5而避免lea。但是,如果非常重要,请尝试以下方法:

#include <stdio.h>
const char localmsg[] = "my local message";

int main()
{

  int result;

  /* Use 'volatile' since 'result' is usually not going to get used. */

  asm volatile ("push %[msg] \n\t" /* Push the address of the string. */
                "call %[puts] \n \t" /* Call the print function. */
                "add $4,%%esp"       /* Clean up the stack. */

                : "=a" (result) /* The result code. */
                : [puts] "m" (puts), [msg] "i" (localmsg)
                : "memory", "esp");

   printf("%d\n", result);
}

作为一个全球性的,localmsg的地址现在在编译时是可以知道的(好吧,我简化了一点),asm产生的样子如下:

push $__ZL8localmsg
call _puts
add $4,%esp

多田。