从源代码复制字符串打印奇怪的字符串

时间:2016-08-05 21:47:39

标签: c string lexer

我正在制作词法分析器,我很难将字符串从文件缓冲区复制到构造函数的字符串属性。这是我用来从缓冲区复制字符串的代码。

    static token_t* lexer_str(lexer_t* lexer) {
    size_t str_len = 0;

    while (true) {
        if (lexer->len < 1) {
            error_new(lexer->errors, lexer->len, lexer->pos, "Unterminated string.");
            return NULL;
        } else if (lexer_look(lexer, 0) == '\"') {
            lexer_adv(lexer, 1);
            break;
        } else {
            lexer_adv(lexer, 1);
            str_len++;
        }
    }

    char* string = malloc(str_len);
    for (size_t idx = 0; idx < str_len; idx++)
        string[idx] = lexer->src[lexer->ptr - str_len + idx];

    token_t* token = token_new(lexer, _str);
    token->string = string;
    return token;
}

这是缓冲区。

"la la la" "me me me"

这是输出,字符串表示为“²²²”

Type:0 {
        Line:   1
        Pos:    0
        Number: 10715872
        Real:   10715872
        String: ²²²²\
}

为什么会这样?只是我从错误的地方读取记忆。对于如何正确地将字符串复制到令牌中的任何帮助都会被批准。

1 个答案:

答案 0 :(得分:0)

第一个char* string = malloc(str_len);太短了,你的字符串在复制后没有空终止(你复制一个给定offset和len的缓冲区,缓冲区不包含一个结束的空字符)

更改为:

char* string = malloc(str_len+1);  // 1 byte more
for (size_t idx = 0; idx < str_len; idx++)
   string[idx] = lexer->src[lexer->ptr - str_len + idx];
 string[str_len] = '\0';  // don't forget to null-terminate

如果源是空的,那么string

中有一个非空终止字符串