内联汇编中的“匹配约束”是什么意思?

时间:2013-09-03 09:52:13

标签: c gcc freebsd inline-assembly powerpc

当我尝试在powerpc arch上编译它们时,这个booth宏会引起警告。

#define INNERMUL asm( \
   " mullw    16,%3,%4       \n\t" \
   " mulhwu   17,%3,%4       \n\t" \
   " addc     16,16,%0       \n\t" \
   " addze    17,17          \n\t" \
   " lwz      18,%1          \n\t" \
   " addc     16,16,18       \n\t" \
   " addze    %0,17          \n\t" \
   " stw      16,%1          \n\t" \
:"=r"(cy),"=m"(_c[0]):"0"(cy),"r"(mu),"r"(tmpm[0]),"1"(_c[0]):"16", "17", "18","%cc"); ++tmpm;

#define PROPCARRY \
asm( \
   " lwz      16,%1         \n\t" \
   " addc     16,16,%0      \n\t" \
   " stw      16,%1         \n\t" \
   " xor      %0,%0,%0      \n\t" \
   " addze    %0,%0         \n\t" \
:"=r"(cy),"=m"(_c[0]):"0"(cy),"1"(_c[0]):"16","%cc");

在每一行调用宏时,编译器都会收到此警告:

../../src/math/mont.c:650: warning: matching constraint does not allow a register

任何人都可以告诉我这意味着什么,以及它影响代码的方式? 因为我真的不习惯汇编,也许有人可以帮助我,特别是在我的情况下会引起警告?

我的系统是32位的freeBSD我正在使用gcc4.8.2

修改

这是相应的x86_64代码,在x86上执行和编译没有问题:

#define INNERMUL \
asm( \
   "movq %5,%%rax \n\t" \
   "mulq %4       \n\t" \
   "addq %1,%%rax \n\t" \
   "adcq $0,%%rdx \n\t" \
   "addq %%rax,%0 \n\t" \
   "adcq $0,%%rdx \n\t" \
   "movq %%rdx,%1 \n\t" \
:"=g"(_c[LO]), "=r"(cy) \
:"0"(_c[LO]), "1"(cy), "r"(mu), "r"(*tmpm++) \
: "%rax", "%rdx", "%cc")

#define PROPCARRY \
asm( \
   "addq   %1,%0    \n\t" \
   "setb   %%al     \n\t" \
   "movzbq %%al,%1 \n\t" \
:"=g"(_c[LO]), "=r"(cy) \
:"0"(_c[LO]), "1"(cy) \
: "%rax", "%cc")

也许这会更清楚代码在powerpc上的行为应该是什么。

1 个答案:

答案 0 :(得分:3)

在这两种情况下,您都有cy_c[0]作为输入/输出变量。您已使用匹配约束将它们正确指定为输出和输入。这可能是PPC特定的,因为"1"在扩展的asm(寄存器号)中具有模糊含义,我自己只在x86上工作。

您可以使用"+"输出量词而不是"="将变量指定为输入/输出变量,从而消除警告(以及可能与之关联的任何错误):

#define INNERMUL asm( \
   " mullw    16,%2,%3       \n\t" \
   " mulhwu   17,%2,%3       \n\t" \
   " addc     16,16,%0       \n\t" \
   " addze    17,17          \n\t" \
   " lwz      18,%1          \n\t" \
   " addc     16,16,18       \n\t" \
   " addze    %0,17          \n\t" \
   " stw      16,%1          \n\t" \
:"+r"(cy) \
,"+m"(_c[0]) \
:"r"(mu) \
,"r"(tmpm[0]) \
:"16", "17", "18","cc"); ++tmpm;

#define PROPCARRY \
asm( \
   " lwz      16,%1         \n\t" \
   " addc     16,16,%0      \n\t" \
   " stw      16,%1         \n\t" \
   " xor      %0,%0,%0      \n\t" \
   " addze    %0,%0         \n\t" \
:"+r"(cy) \
,"+m"(_c[0]) \
: \
:"16","cc");
来自gcc扩展asm手册的

编辑

  

扩展的asm支持输入输出或读写操作数。使用约束字符“+”表示这样的操作数,并将其与输出操作数一起列出。

此外,我不确定"%cc"是否为有效的clobber标识符,通常您不会为"%"添加前缀。在x86上,相应的标识符为"cc"