读取文本文件时C程序中的分段错误

时间:2016-11-11 16:43:06

标签: c text-files

我想从文本文件中以这种格式(word:defn)打印一堆带有定义的单词。但是,在服务器上使用gcc运行程序时遇到分段错误。奇怪的是,当我在本地桌面上编译C程序时,该程序运行良好。

{{1}}

文本文件:

  

COOKIE。是一种小而扁平的甜味烘焙食品,通常含有面粉,鸡蛋,糖,黄油,食用油或其他油脂。它可能包括其他成分,如葡萄干,燕麦,巧克力片或坚果。

     

ICE CREAM。是一种加糖的冷冻食品,通常作为零食或甜点食用。

1 个答案:

答案 0 :(得分:1)

字长限制为49个字符,定义为499个字符,但您从不检查代码中的溢出。如果与您的示例不同,服务器上使用的字典具有较长的单词和/或定义,则您的代码会调用未定义的行为,这可能会导致分段错误。

未定义的行为也可能不会导致任何可见的效果,就像本地计算机上的情况一样。由于版本不同或命令行选项不同,本地编译器生成的代码和服务器生成的代码可能不同。

检查数组边界以避免这种情况:

#include <stdio.h>
#include <stdlib.h>
#include <string.h>

int read_dict() {
    FILE *fp;
    int c;
    char word[50];
    char defn[500];
    int sep = 0;
    int doublenew = 0;
    size_t i = 0;

    fp = fopen("textfile.txt", "r");
    if (fp == NULL) {
        perror("Error in opening file");
        return (-1);
    }

    while ((c = fgetc(fp)) != EOF) {
        if (feof(fp)) {
            break;
        }
        if (c == '\r') {
            /* ignore CR characters inserted by Windows before LF */
            continue;
        }
        if (c == '.' && sep == 0) {
            sep = 1;
            word[i] = '\0';
            //c = fgetc(fp);
            i = 0;
        } else
        if (doublenew == 1 && c == '\n' && sep == 1) {
            if (i < sizeof(defn) - 1) {
                defn[i] = c;
                i++;
            }
            defn[i] = '\0';
            printf("%s %s", word, defn);
            i = 0;
            sep = 0;
            doublenew = 0;
        } else
        if (c == '\n' && sep == 1) {
            if (i < sizeof(defn) - 1) {
                defn[i] = c;
                i++;
            }
            doublenew = 1;
        } else
        if (sep == 0) {
            if (i < sizeof(word) - 1) {
                word[i] = c;
                i++;
            }
        } else
        if (sep == 1) {
            if (i < sizeof(defn) - 1) {
                defn[i] = c;
                i++;
            }
            doublenew = 0;
        }
    }
    fclose(fp);
    return 0;
}

注意:如果服务器上没有打印任何内容,则表示该文件没有2个连续的换行符'\n'。如果您在系统和服务器上使用相同的文件,并且在服务器上使用系统上的Windows和服务器上的Linux,则程序的行为将因Windows使用的'\r'字符而异。行尾。您必须显式忽略这些字符,因为它们仅在Windows上被隐式忽略,而不是在Linux上。我修改了上面的代码来解释这个问题。