从文件读取到char数组,C

时间:2016-08-23 13:29:14

标签: c linux optimization valgrind indentation

我在使用此代码时遇到了一些问题,并且会介意获得一些帮助。此函数从文件读取到动态分配的内存

感谢@JonathanLeffler的帮助 - 功能缩进非常有效!但是又出现了一个问题:函数read_file,从文件读取到char数组,稍后传递给缩进。

=============================================== ==========================

//--------------- read_file valgrind validations --------------------
==396== 144 bytes in 1 blocks are definitely lost in loss record 62 of 66 
==396==    at 0x4C2AD10: calloc (in /usr/lib/valgrind/vgpreload_memcheck-amd64-linux.so) 
==396==    by 0x401AC1: read_file (polisher.c:24) 
==396==    by 0x4025CE: test_indent (test_source.c:174) 
==396==    by 0x406BC7: srunner_run (in /tmc/test/test) 
==396==    by 0x402C67: tmc_run_tests (tmc-check.c:134) 
==396==    by 0x402902: main (test_source.c:235) 
==396== 

=============================================== ==

char *read_file(const char *filename)
{
    FILE *f = fopen(filename, "r");
    if(!f)
        return NULL;
    int n = 0, c = 0;
    char *a = NULL;
    c = fgetc(f);
    while(c != EOF)
    {
        n++;
        c = fgetc(f);
    }
    freopen(filename, "r", f);
    a = calloc(n + 1, sizeof(char));
    c = fgetc(f);
    n = 0;
    while(c != EOF)
    {
        a[n] = c;
        n++;
        c = fgetc(f);
    }
    a[n] = '\0';
    fclose(f);
    return a;
}

=============================================== =================

START_TEST(test_indent)
{
    char *str = read_file("testifile.c");
    if (!str) str = read_file("test/testifile.c");
    if (!str) {
        fail("[M6.01.c] read_file(\"testifile.c\") returned NULL");
    }
    char *res = indent(str, "    ");
    if (!res) {
        free(str);
        free(res);
        fail("[M6.01.c] indent(\"testifile.c\") returned NULL");
    }

    char buf[OUTPUTLEN];
    if (mycompare_new(res, ref61c, buf, OUTPUTLEN)) {
        free(res);
        free(str);
        fail("[M6.01.c] Invalid string from indent(\"testifile.c\"): %s", buf);
    }
    free(str);
    free(res);
    test_complete();
}
END_TEST

1 个答案:

答案 0 :(得分:1)

您的基本问题是,将单个字符添加到输出缓冲区的代码不会检查是否有额外字符的空间,而且可能没有。您可以使用较长的缩进(例如" /* Look Ma! */ ",即16个字符)来更快地抓住错误。

您目前的位置:

        continue;
    } 
    dest[dest_offset++] = c;        
    input++;
}
蛮力和粗心的解决方案补充道:

        continue;
    }
    if (dest_offset >= dest_len)
    {
        printf("XX: DO = %zu, DL = %zu, PL = %zu, LV = %zu\n", dest_offset, dest_len, pad_len, pad_level);
        putchar('@');fflush(0);
        char *ptr = realloc(dest, dest_len * 2);
        if(!ptr)
        {
            free(dest);
            return NULL;
        }
        dest_len *= 2;
        dest = ptr;
    }
    putchar('.');fflush(0);
    dest[dest_offset++] = c;
    input++;
}

哦,我留下了一些我最终在显示器上使用的调试代码。我添加了很多模糊的类似打印代码。循环顶部的断言也有助于:assert(dest_offset <= dest_len);。当它开始射击时,事情变得更加清晰(但我花了一些时间才发现它为什么会开火)。我还在换行处理代码中对测试进行了测试:

        if (dest_offset >= dest_len || (pad_len * pad_level + 1) >= (dest_len - dest_offset))
        {
            printf("YY: DO = %zu, DL = %zu, PL = %zu, LV = %zu\n", dest_offset, dest_len, pad_len, pad_level);
            putchar('@');fflush(0);
            char *ptr = realloc(dest, dest_len * 2);
            if(!ptr)
            {
                free(dest);
                return NULL;
            }
            dest_len *= 2;
            dest = ptr;
        }

realloc()从未被解雇,这是其中一个惊喜。

我认为你需要一个函数来向输出缓冲区添加一个字符,你需要将输出缓冲区控件包装成一个结构(struct Buffer { char *buffer; size_t maxlen; size_t curlen; }或其左右),并且你有一个函数处理( re)根据需要分配空间。这将避免蛮力和粗心大意的重复出现。解。如果您愿意,可以使它成为static inline函数 - 编译器可以避免一些开销,而不会影响代码的可读性。还有一个令人讨厌的重复,两个循环将缩进的倍数添加到缓冲区。当然,最好用另一种功能来处理 - 但它会与“添加一个字符”不同。因为你可以明智地检查足够的空间并进行一次重新分配。或者编写函数来获取长度和指向非空终止缓冲区的指针(因此单个字符的长度为1,填充字符串的长度为pad_len)并且单个函数可以执行整个操作 - 可能是更好的解决我仍然将控件打包到一个结构中,让编译器进行优化。

测试main()

int main(void)
{
    char data[] = "#include <stdio.h>\nint main(void)\n{\nputs(\"Hello World!\\n\");\nreturn 0;\n}\n";
    printf("Before: [[%s]]\n", data);
    fflush(0);
    char *reformatted = indent(data, " /* Look Ma! */ ");
    printf("Indent: -complete-\n");
    fflush(0);
    printf("Source: [[%s]]\n", data);
    fflush(0);
    printf("Target: [[%s]]\n", reformatted);
    free(reformatted);
    return 0;
}