这是C代码,我用gcc编译
char *a="a";
char *d="d";
printf("%d\n", strcmp("a", "d"));
printf("%d\n", strcmp(a, "d"));
printf("%d\n", strcmp(a, d));
当我用-O
编译时,输出是
-1
-3
-1
当我编译时没有-O
,那么输出是
-1
-3
-3
为什么输出不同,strcmp
的代码是什么?
答案 0 :(得分:5)
为什么输出不同
因为重要的是返回值的符号(正,负或零)。 strcmp()
不需要返回+1或-1,也不必返回一致的值。我怀疑在第一种和第三种情况下,编译器优化了对strcmp()
的调用,并将-1置于返回值的位置。在第二种情况下,我认为函数实际上是被调用的。
strcmp的代码是什么?
由于它似乎返回了第一个不同角色的字符代码之间的差异这一事实,我会说这是glibc的strcmp()
:
int
strcmp (p1, p2)
const char *p1;
const char *p2;
{
register const unsigned char *s1 = (const unsigned char *) p1;
register const unsigned char *s2 = (const unsigned char *) p2;
unsigned char c1, c2;
do
{
c1 = (unsigned char) *s1++;
c2 = (unsigned char) *s2++;
if (c1 == '\0')
return c1 - c2;
}
while (c1 == c2);
return c1 - c2;
}
编辑: @AndreyT不相信我,所以这里是为我生成的汇编GCC 4.2(OS X 10.7.5 64位Intel,默认优化级别 - 无标志):
.section __TEXT,__text,regular,pure_instructions
.globl _main
.align 4, 0x90
_main:
Leh_func_begin1:
pushq %rbp
Ltmp0:
movq %rsp, %rbp
Ltmp1:
subq $32, %rsp
Ltmp2:
leaq L_.str(%rip), %rax
movq %rax, -16(%rbp)
leaq L_.str1(%rip), %rax
movq %rax, -24(%rbp)
movl $-1, %ecx ; <- THIS!
xorb %dl, %dl
leaq L_.str2(%rip), %rsi
movq %rsi, %rdi
movl %ecx, %esi
movq %rax, -32(%rbp)
movb %dl, %al
callq _printf ; <- no call to `strcmp()` so far!
movq -16(%rbp), %rax
movq %rax, %rdi
movq -32(%rbp), %rsi
callq _strcmp ; <- strcmp()
movl %eax, %ecx
xorb %dl, %dl
leaq L_.str2(%rip), %rdi
movl %ecx, %esi
movb %dl, %al
callq _printf ; <- printf()
movq -16(%rbp), %rax
movq -24(%rbp), %rcx
movq %rax, %rdi
movq %rcx, %rsi
callq _strcmp ; <- strcmp()
movl %eax, %ecx
xorb %dl, %dl
leaq L_.str2(%rip), %rdi
movl %ecx, %esi
movb %dl, %al
callq _printf ; <- printf()
movl $0, -8(%rbp)
movl -8(%rbp), %eax
movl %eax, -4(%rbp)
movl -4(%rbp), %eax
addq $32, %rsp
popq %rbp
ret
Leh_func_end1:
.section __TEXT,__cstring,cstring_literals
L_.str:
.asciz "a"
L_.str1:
.asciz "d"
L_.str2:
.asciz "%d\n"
.section __TEXT,__eh_frame,coalesced,no_toc+strip_static_syms+live_support
EH_frame0:
Lsection_eh_frame:
Leh_frame_common:
Lset0 = Leh_frame_common_end-Leh_frame_common_begin
.long Lset0
Leh_frame_common_begin:
.long 0
.byte 1
.asciz "zR"
.byte 1
.byte 120
.byte 16
.byte 1
.byte 16
.byte 12
.byte 7
.byte 8
.byte 144
.byte 1
.align 3
Leh_frame_common_end:
.globl _main.eh
_main.eh:
Lset1 = Leh_frame_end1-Leh_frame_begin1
.long Lset1
Leh_frame_begin1:
Lset2 = Leh_frame_begin1-Leh_frame_common
.long Lset2
Ltmp3:
.quad Leh_func_begin1-Ltmp3
Lset3 = Leh_func_end1-Leh_func_begin1
.quad Lset3
.byte 0
.byte 4
Lset4 = Ltmp0-Leh_func_begin1
.long Lset4
.byte 14
.byte 16
.byte 134
.byte 2
.byte 4
Lset5 = Ltmp1-Ltmp0
.long Lset5
.byte 13
.byte 6
.align 3
Leh_frame_end1:
.subsections_via_symbols
原始源代码:
#include <stdio.h>
#include <string.h>
int main()
{
const char *a = "a";
const char *d = "d";
printf("%d\n", strcmp("a", "d"));
printf("%d\n", strcmp(a, "d"));
printf("%d\n", strcmp(a, d));
return 0;
}
它生成的输出(截图有更好的证明):
答案 1 :(得分:3)
C标准允许实现返回任何负值。它还允许实现对库函数调用进行优化,只要结果符合标准...因此,实现可以通过生成内联机器指令而不是调用函数来优化strcmp
之类的函数。当参数是常量时,可以进行额外的优化。因此结果不同的原因是因为优化器恰好为某些情况生成了不同的代码。合规程序不允许关注返回哪个负值。
编辑:
目前在我的系统上,输出是
-1
-3
-3
以下是编译器生成的产生这些结果的代码(使用gcc -S获得):
movl $-1, 4(%esp)
movl $LC2, (%esp)
call _printf
movl $LC1, 4(%esp)
movl 28(%esp), %eax
movl %eax, (%esp)
call _strcmp
movl %eax, 4(%esp)
movl $LC2, (%esp)
call _printf
movl 24(%esp), %eax
movl %eax, 4(%esp)
movl 28(%esp), %eax
movl %eax, (%esp)
call _strcmp
movl %eax, 4(%esp)
如您所见,只有两个strcmp
次来电。第一次比较的-1结果是在编译时生成的,因为编译器知道“a”小于“d”。如果我使用-O,它会产生以下代码:
movl $-1, 4(%esp)
movl $LC0, (%esp)
call _printf
movl $-1, 4(%esp)
movl $LC0, (%esp)
call _printf
movl $-1, 4(%esp)
movl $LC0, (%esp)
call _printf
答案 2 :(得分:2)
我正在
-1
-3
-1
在Linux上使用GCC 4.1.2进行优化(-O4
)构建的输出。这是编译器为main
main:
.LFB25:
subq $8, %rsp
.LCFI0:
movl $-1, %esi
xorl %eax, %eax
movl $.LC0, %edi
call printf
movzbl .LC1(%rip), %edx
movzbl .LC2(%rip), %eax
movl %edx, %esi
subl %eax, %esi
jne .L2
movzbl .LC1+1(%rip), %esi
movzbl .LC2+1(%rip), %eax
subl %eax, %esi
.L2:
movl $.LC0, %edi
xorl %eax, %eax
call printf
movl $-1, %esi
movl $.LC0, %edi
xorl %eax, %eax
call printf
xorl %eax, %eax
addq $8, %rsp
ret
这意味着第一次和最后一次比较实际上已经过优化,而中间比较实际上是通过减法实现的(这就是它产生-3
的原因)。我没有看到这种选择性行为中的任何逻辑,所以它可能只是优化器的一个怪癖。
-1
-1
-1
输出,因为它调用strcmp
。此标准库中的strcmp
实现为
<strcmp> mov (%rdi),%al
<strcmp+2> cmp (%rsi),%al
<strcmp+4> jne <strcmp+19>
<strcmp+6> inc %rdi
<strcmp+9> inc %rsi
<strcmp+12> test %al,%al
<strcmp+14> jne <strcmp>
<strcmp+16> xor %eax,%eax
<strcmp+18> retq
<strcmp+19> mov $0x1,%eax
<strcmp+24> mov $0xffffffff,%ecx
<strcmp+29> cmovb %ecx,%eax
<strcmp+32> retq
这意味着有意实施它以返回-1
,0
或+1
,即使它可能被视为次优。
答案 3 :(得分:1)
strcmp
会返回< 0
它表示第二个字符串对于字符串中不匹配的第一个字符具有更高的值。确切的精确值是未指定
唯一定义的是输出是否为: