在汇编中实现wc

时间:2015-05-27 05:40:32

标签: c assembly

我正在尝试将典型的wc C代码转换为intel汇编代码。 C代码是源代码,而aseembly是我制作的代码。 由于它没有任何函数调用,我认为这会起作用,但它总是如此 结果iCharCount损坏,iLineCount保持为0.可能是什么问题?

C代码

#include <stdio.h>
#include <ctype.h>
enum {FALSE, TRUE};
int main(void){
   int iLineCount = 0;
   int iWordCount = 0;
   int iCharCount = 0;
   int iChar;
   int iInWord = FALSE;
   iChar = fgetc(stdin);
   for( ;iChar != EOF; ){
      iCharCount++;

      if (iChar == '\n') iLineCount++;
      if (isspace(iChar)){
         if (iInWord){
            iWordCount++;
            iInWord = FALSE;
         }
      }
      else if (!iInWord) iInWord = TRUE;
      iChar = fgetc(stdin);
   }

   if (iInWord) iWordCount++;
   printf("%7d%8d%8d\n", iLineCount, iWordCount, iCharCount);
   return 0;
}

汇编代码

    .file "wc.s"
    .section        .rodata
    .equ TRUE, 1
    .equ FALSE, 0
    .equ SPACE, 32
    .equ LCHANGE, 10
    .equ TAB, 9
    .equ EOF, -1
    .globl main
    .type main, @function
main:
start:
    pushl %ebp
    movl %esp, %ebp
    andl $-16, %esp
    subl $48, %esp
    movl $0, 20(%esp) #int iLineCount = 0
    movl $0, 24(%esp) #int iWordCount
    movl $0, 28(%esp) #int iCharCount
    movl $0, 36(%esp) #int iInWord = FALSE
    movl stdin, %eax
    movl %eax, (%esp)
    call fgetc
    movl %eax, 32(%esp) #iChar = fgetc(stdin)
    cmpl $EOF, 8(%ebp) #Start of for( ;iChar != EOF;)
    je endloop
loop:
    incl 28(%ebp)   #iCharCount++
    cmpl $LCHANGE, 32(%ebp) #if(iChar == '\n')
    jne ecomp1
    incl 20(%esp) #iLineCount++
ecomp1:
    cmpl $LCHANGE, 32(%esp) #if(isspace(iChar) ->'\n'
    je isspace
    cmpl $SPACE, 32(%esp) #-> ' '
    je isspace
    cmpl $TAB, 32(%esp) # -> '\t'
    je isspace
    jmp elsespace
isspace:
    cmpl $TRUE, 36(%esp)    #if(iInWord)
    jne last
    movl $FALSE, 36(%esp) #iInWord = FALSE
    incl 24(%esp)   #iWordCount++
    jmp last
elsespace:
    cmpl $FALSE, 36(%esp)   #if(!InWord)
    jne last
    movl $TRUE, 36(%esp)    #iInWord = TRUE
last:
    movl stdin, %eax
    call fgetc
    movl %eax, 32(%esp)     #iChar = fgetc(stdin)
    cmpl $EOF, 32(%esp)     #Recheck for statement
    jne loop
endloop:
    cmpl $TRUE, 36(%esp)    #if(iInWord)
    jne else
    incl 24(%esp)   #iWordCount++
else:
    movl 28(%esp), %eax
    movl %eax, 12(%esp) #push iCharCount in printf
    movl 24(%esp), %eax
    movl %eax, 8(%esp) #push iWordCount in printf
    movl 20(%ebp), %eax
    movl %eax, 4(%esp) #push iLineCount in printf
    movl $.format, (%esp)
    call printf
    leave
    ret
.format:
    .string "%7d%8d%8d\n"
    .text

1 个答案:

答案 0 :(得分:1)

装配清单中缺少标记:缺少标记last以及循环结束时的iChar = fgetc(stdin);

您应该简化C代码。首先使用经典成语:

while ((iChar = fgetc(stdin)) != EOF) { ... }

无需进行测试
else if (!iInWord) iInWord = TRUE;

这里也不需要进行2次测试:

  if (isspace(iChar)){
     if (iInWord){
        iWordCount++;
        iInWord = FALSE;
     }
  }

您可以通过这种方式简化循环和单词测试:

while ((iChar = fgetc(stdin)) != EOF) {
    iCharCount++;
    if (iChar == '\n') iLineCount++;
    if (isspace(iChar)) {
        iWordCount += iInWord;
        iInWord = 0;
    } else {
        iInWord = 1;
    }
}
iWordCount += iInWord;

printf格式不合适:如果计数过大,数字会粘在一起。请改用:

printf("%7d %7d %7d\n", iLineCount, iWordCount, iCharCount);

至于汇编版本,它似乎是由编译器生成的,然后手工补丁。您确实重写了isspace()测试,但没有测试一些空白字符,例如'\r''\f''\n'的测试是多余的,您可以在递增isspace:后跳转到iLineCount

编辑:汇编代码的问题是:您有时会错误地使用%ebp代替%esp来访问本地变量。

    ...
    cmpl $EOF, 8(%ebp) #Start of for( ;iChar != EOF;)
    ...
loop:
    incl 28(%ebp)   #iCharCount++
    cmpl $LCHANGE, 32(%ebp) #if(iChar == '\n')
    ...
    movl 20(%ebp), %eax
    ...