C代码非常简单:从名为file_bib1
的文件中获取每一行文本以供进一步分析(尚未实现)。这是代码:
int main ()
{
FILE * fp;
char *a;
int check;
int end = 0;
long int size;
long int start = 0;
fp = fopen("file_bib1", "r");
while ( end != 1 )
{
size = 0;
if (ftell(fp) != 0)
start = ftell(fp) + 1;
fseek(fp, start, SEEK_SET);
while (getc(fp) != '\n')
size = size + 1;
fseek(fp, start, SEEK_SET);
a = (char*) malloc(size * sizeof(char));
check = fscanf(fp, "%[^\n]", a);
if( check == 0)
{
fscanf(fp, "%[^\EOF]", a);
end = 1;
}
printf("%s\n", a);
free(a);
}
fclose(fp);
return 0;
}
这是'file_bib1'的内容:
autore: Di Ciccio , Antonio; titolo: Manuale di architettura pisana; editore: Palestro; anno: 1990; prestito: t Fri Feb 10 00:00:00 CET 2012; volume: 1345; scaffale: A.west.2;
autore : Di Ciccio , Antonio; titolo: Manuale di architettura pisana; editore: Palestro; anno: 1990; luogo_pubblicazione: Milano; prestito: 10-02-2012; collocazione: B.23.4;descrizione_fisica: 123 p., ill, 23 cm;
autore: Melis, Antonio Pietro Angelo; autore: Gatto Magnolfi, Gianni; titolo:Manuale di architettura fiorentina; editore: EQR; anno: 1910; nota: Copia del Vescovo; collocazione: Z.12.56; luogo_pubblicazione: Firenze; descrizione_fisica: 34 p., cov, 59 cm;
autore: Kernighan, Brian W.; autore: Ritchie, Dennis M.; titolo: Il linguaggio C (seconda Edizione); editore: Jackson Libri; anno: 1989; nota: Edizione italiana; collocazione: Z.22.56; luogo_pubblicazione: Milano; descrizione_fisica: 359 p., softcov, 13 cm;
autore: Kernighan, Brian W.; autore: Pike, Rob; titolo: Programmazione nella Pratica; editore: Addison-Wesley Longman Italia Editoriale; anno: 1999; nota: Edizione italiana; collocazione: Z.24.56; luogo_pubblicazione: Milano; descrizione_fisica: 294 p., softcov, 13 cm; prestito: 13-07-2012;
autore: Singh, Jaswinder Pal; autore: Culler, David E.; autore: Gupta,Anoop; titolo: Parallel Computer Architecture: A Hardware/Software Approach; editore: Morgan Kaufmann; anno: 1999; nota: Copia M. Fillo; collocazione: QA76 58; luogo_pubblicazione: San Francisco, CA; descrizione_fisica: 1021 p., cov, ill, 23 cm;
autore: Hennessy, John L.; autore: Patterson, David A.; titolo: Computer Architecture, Fifth Edition: A Quantitative Approach ; editore: Morgan Kaufmann; anno: 2011; nota: ; collocazione: HHH.56; luogo_pubblicazione: San Francisco, CA; descrizione_fisica: 896 p., softcov, 7 1/2 X 9 1/4 inc;
autore: Luccio, Fabrizio; autore: Pagli, Linda; autore: Steel, Graham;titolo:Mathematical and Algorithmic Foundations of the Internet ; editore: CRC Press, Taylor and Francis Group; anno: 2011; nota: Chapman & Hall/CRC Applied Algorithms and Data Structures series; collocazione: Z.DDf.56; luogo_pubblicazione: New York; descrizione_fisica: 434 p., softcovcov, 22 cm;
autore : Di Ciccio , Antonio; titolo: Manuale di architettura pisana; editore: Palestro; anno: 1990; luogo_pubblicazione: Milano; prestito: 10-0-2012; collocazione: B.23.4;descrizione_fisica: 123 p., ill, 23 cm;
autore: Melis, Antonio Pietro Angelo; autore: Gatto Magnolfi, Gianni; titolo:Manuale di architettura fiorentina; editore: EQR; anno: 1910; nota: Copia del Vescovo; collocazione: Z;12.56; luogo_pubblicazione: Firenze; descrizione_fisica: 34 p., cov, 59 cm;
autore: Melis, Antonio Pietro Angelo; autore:, Gianni; titolo:Manuale di architettura fiorentina; editore: EQR; anno: 1910; nota: Copia del Vescovo; collocazione: Z.12.56; luogo_pubblicazione: Firenze; descrizione_fisica: 34 p., cov, 59 cm;
autore: Singh, Jaswinder Pal; autore: Culler, David E.; autore: Gupta,Anoop; titolo: Parallel Computer Architecture: A Hardware/Software Approach; editore: Morgan Kaufmann; 1999; nota: Copia M. Fillo; collocazione: QA76 58; luogo_pubblicazione: San Francisco, CA; descrizione_fisica: 1021 p., cov, ill, 23 cm;
autore: Hennessy, John L.; autore: Patterson, David A.; titolo: Computer Architecture, Fifth Edition: A Quantitative Approach ; editore: Morgan Kaufmann; anno: 2011; nota: ; collocazione: HHH.56; luogo_pubblicazione: San Francisco, CA; descrizione_fisica: 896 p.; softcov, 7 1/2 X 9 1/4 inc;
autore: Luccio, Fabrizio; autore: Pagli, Linda; autore: Steel, Graham;titolo:Mathematical and Algorithmic Foundations of the Internet ; editore: CRC Press, Taylor and Francis Group; anno: 2011; nota: Chapman & Hall/CRC Applied Algorithms and Data Structures series; collocazione: Z.DDf.56; luogo_pubblicazione: New York; descrizione_fisica: 434 p., softcovcov, 22 cm
autore: Melis, Antonio Pietro Angelo; autore: Gatto Magnolfi, Gianni; titolo: Manuale di architettura fiorentina; editore: EQR; anno: 2010; nota: Copia del Vescovo; prestito: f; volume: 5; Scaffale; B.12;
每行以\n
结束,最后一行以EOF
照常结束。
当我运行代码时,我在linux终端中看到这个错误,直到运行到文件中间
*** glibc detected *** ./prova: double free or corruption (!prev): 0x00000000017e8250 ***
======= Backtrace: =========
/lib/x86_64-linux-gnu/libc.so.6(+0x7e626)[0x7f0049d92626]
./prova[0x400880]
/lib/x86_64-linux-gnu/libc.so.6(__libc_start_main+0xed)[0x7f0049d3576d]
./prova[0x4006a9]
======= Memory map: ========
00400000-00401000 r-xp 00000000 08:01 18770 /home/arrigo/Desktop/prova
00600000-00601000 r--p 00000000 08:01 18770 /home/arrigo/Desktop/prova
00601000-00602000 rw-p 00001000 08:01 18770 /home/arrigo/Desktop/prova
017e8000-01809000 rw-p 00000000 00:00 0 [heap]
7f0049afe000-7f0049b13000 r-xp 00000000 08:01 5697 /lib/x86_64-linux-gnu/libgcc_s.so.1
7f0049b13000-7f0049d12000 ---p 00015000 08:01 5697 /lib/x86_64-linux-gnu/libgcc_s.so.1
7f0049d12000-7f0049d13000 r--p 00014000 08:01 5697 /lib/x86_64-linux-gnu/libgcc_s.so.1
7f0049d13000-7f0049d14000 rw-p 00015000 08:01 5697 /lib/x86_64-linux-gnu/libgcc_s.so.1
7f0049d14000-7f0049ec7000 r-xp 00000000 08:01 5676 /lib/x86_64-linux-gnu/libc-2.15.so
7f0049ec7000-7f004a0c6000 ---p 001b3000 08:01 5676 /lib/x86_64-linux-gnu/libc-2.15.so
7f004a0c6000-7f004a0ca000 r--p 001b2000 08:01 5676 /lib/x86_64-linux-gnu/libc-2.15.so
7f004a0ca000-7f004a0cc000 rw-p 001b6000 08:01 5676 /lib/x86_64-linux-gnu/libc-2.15.so
7f004a0cc000-7f004a0d1000 rw-p 00000000 00:00 0
7f004a0d1000-7f004a0f3000 r-xp 00000000 08:01 5656 /lib/x86_64-linux-gnu/ld-2.15.so
7f004a2d2000-7f004a2d5000 rw-p 00000000 00:00 0
7f004a2ee000-7f004a2f3000 rw-p 00000000 00:00 0
7f004a2f3000-7f004a2f4000 r--p 00022000 08:01 5656 /lib/x86_64-linux-gnu/ld-2.15.so
7f004a2f4000-7f004a2f6000 rw-p 00023000 08:01 5656 /lib/x86_64-linux-gnu/ld-2.15.so
7fff9a14f000-7fff9a170000 rw-p 00000000 00:00 0 [stack]
7fff9a1ff000-7fff9a200000 r-xp 00000000 00:00 0 [vdso]
ffffffffff600000-ffffffffff601000 r-xp 00000000 00:00 0 [vsyscall]
Aborted
任何人都可以帮我“翻译”这个错误吗?
------------------- EDIT ----------
发现错误。 在代码中有一些printf,我发现'free(a)'中的错误但我无法理解它为什么会产生这样的错误......
--------- EDIT ------------
我发现了真正的问题......程序失败的有罪行,在;
终结符之后以空白空间结束......在某种程度上,free(a)
发疯了
答案 0 :(得分:1)
您的问题是您没有分配足够的内存来存储您的线路(如R ..的注释中所示)。您可以通过打印所读内容的strlen
和size
的值来发现这一点。他们是一样的。这意味着fscanf
在写入终止NUL
字符时将超出输入缓冲区,这会损坏堆。您收到的错误消息是glibc
抱怨其已损坏的状态。
它在第一个输入行上没有发生的原因并不是很重要,因为写入超出分配的内存会导致未定义的行为,未定义的行为包括它不会导致问题。程序应该修复未定义的行为,不仅因为它是正确的做法,而且因为它最终可能会导致问题。
您可以通过在扫描字符串中指定最大长度说明符来避免此问题,但您必须在缓冲区中构建扫描字符串才能实现此目的。
char fmt[64];
snprintf(fmt, sizeof(fmt), "%%%d[^\n]", size);
check = fscanf(fp, fmt, a);
但是你还需要添加代码来检查你是否真的读完了整行。您可能要做的修复是将分配的大小增加一,以考虑终止NUL
。但是,修复此问题后,您的程序将处于无限循环中。这是因为您的getc
循环未检查EOF
。你需要添加它。
int c;
while ((c = getc(fp)) != '\n') {
if (c == EOF) {
end = 1;
break;
}
size = size + 1;
}
if (!end) {
//...
}
你的第二个扫描字符串%[^\EOF]
可能不是你认为的意思。无论如何都没有真正的方法告诉fscanf
扫描到文件末尾。如果check
失败,则更容易报告失败并退出。然后,您可以稍后弄清楚输入导致其失败的原因,并修复输入。
fscanf
使用起来很棘手。缓冲区溢出是一个问题,但如果输入没有您期望的格式,该函数也会出现意外行为。这就是为什么程序员会建议无条件地将输入读入缓冲区,并解析缓冲区,而不是使用fscanf
同时读取和解析输入。
您可以实现一些简单的代码,仅使用fgets
以某些复制为代价获取一行。如果缓冲区没有以\n
结束,则调整缓冲区的大小,然后继续读取。
size_t size = 256;
char *line = malloc(size);
line[size-2] = '\0';
while (fgets(line, size, fp) != 0) {
while (line[size-2] && line[size-2] != '\n') {
char *bigger_line = realloc(line, 2*size);
assert(bigger_line); // rudimentary error handling
size *= 2;
line = bigger_line;
line[size-2] = '\0';
if (fgets(line + size/2 - 1, size/2 + 1, fp) == 0) {
// last line doesn't end with '\n'
break;
}
}
//... handle input line
}
//...
free(line);