使用strtok组伪标记拆分字符串

时间:2019-01-15 10:18:40

标签: c strtok

我试图逐行读取文本文件,并将每一行拆分为一个令牌。但是当我尝试解析

D: 0 S: 0
push 0
prti
halt

第一行出现错误。结果是

0: [D:] [0 S] [0] (3 Token)
1: [push] [0] (2 Token)
2: [prti] (1 Token)
3: [halt] (1 Token)

但我期望

0: [D:] [0] [S:] [0] (4 Token) <--
1: [push] [0] (2 Token)
2: [prti] (1 Token)
3: [halt] (1 Token)

第二个标记应为0,第三个标记应为S:但是如第一个结果所示,第二个标记为“ 0 s”,第三个标记为0,没有第四个标记。

我添加了一个示例

#include <stdio.h>
#include <stdlib.h>

char *trimwhitespace(char *str) {
  char *end;
  while(isspace((unsigned char)*str)) str++;
  if(*str == 0) return str; 
  end = str + strlen(str) - 1;
  while(end > str && isspace((unsigned char)*end)) end--;
  end[1] = '\0';
  return str;
}

int main(void) {

    FILE * fp;
    char * line = NULL;
    size_t len = 0;
    ssize_t read;

    int tokencounter = 0;
    char *token;
    int linecounter;
    int address = 0;

    char *tokentemp;

    fp = fopen("test.asm", "r");
    if (fp == NULL) exit(1);

    while ((read = getline(&line, &len, fp)) != -1) {   

        token = strtok(line, " ");
        tokencounter = 0;

        printf("%d: ", linecounter);

        while( token != NULL ) {

            token = trim( token );
            printf( "[%s] ", token );
            tokencounter++;                
            token = strtok(NULL, line);           

        }

        printf("(%d Token)\n", tokencounter);

        linecounter++;

    }

    fclose(fp);
    if (line) free(line);
    exit(1);

}

1 个答案:

答案 0 :(得分:0)

您对strtok的第二次调用使用了错误的参数。

代替

token = strtok(NULL, line);

token = strtok(NULL, " ");

如果您使用line作为分隔符的参数,则第二个调用将从line开始的:开始,这样strtok就会分裂成{{1 }}首先(而不是您期望的:上。)