写在数组外的位置

时间:2013-08-27 17:48:35

标签: c arrays null kernighan-and-ritchie

我刚开始学习编程。这是我的第一篇文章。我正在读Kernighan和Ritchie的一本书“C Programming Language”,我遇到了一个我不理解的例子(第1.9节,第30页)。

此程序将文本作为输入,确定最长行并打印它。 声明了Char数组行[MAXLINE],其中MAXLINE为1000.这应该意味着该数组的最后一个元素的索引为MAXLINE-1,即999。 但是,如果你看一下函数getline,它是作为参数传递line []数组(并且MAXLINE为lim),看来如果用户输入是一个长于MAXLINE的行,我将递增直到i = lim,是,我= MAXLINE。因此,语句行[i] ='\ 0'将为行[MAXLINE] ='\ 0'。

这对我来说不对 - 如果行[]的大小是MAXLINE,我们如何写入行[MAXLINE]位置。它不会写入阵列外的位置吗?

我能想到的唯一解释是,当声明char数组[size]时,C语言实际上创建了char数组[size + 1]数组,其中最后一个元素是为NULL字符保留的。如果是这样,这很令人困惑,书中没有提到。任何人都可以证实这一点,或解释发生了什么?

#include <stdio.h>
#define MAXLINE 1000 /* maximum input line length */
int getline(char line[], int maxline);
void copy(char to[], char from[]);

/* print the longest input line */
main()
{
    int len;                           /* current line length */
    int max;                          /* maximum length seen so far */
    char line[MAXLINE];          /* current input line */
    char longest[MAXLINE];     /* longest line saved here */

    max = 0;

    while ((len = getline(line, MAXLINE)) > 0)
           if (len > max) {
           max = len;
           copy(longest, line);
           }
    if (max > 0) /* there was a line */
           printf("%s", longest);

return 0;
}

/* getline: read a line into s, return length */
int getline(char s[],int lim)
{
    int c, i;

    for (i=0; i < lim-1 && (c=getchar())!=EOF && c!='\n'; ++i)
        s[i] = c;
    if (c == '\n') {
        s[i] = c;
        ++i;
    }
    s[i] = '\0';

return i;
}

/* copy: copy 'from' into 'to'; assume to is big enough */
void copy(char to[], char from[])
{
    int i;
    i = 0;

    while ((to[i] = from[i]) != '\0')
        ++i;
}

4 个答案:

答案 0 :(得分:3)

for循环似乎正在getline中进行阅读:

for (i=0; i < lim-1 && (c=getchar())!=EOF && c!='\n'; ++i)
    s[i] = c;

看起来i会递增,直到达到lim - 1,而不是lim(如果你说话的话lim等于MAXLINE关于)。因此,如果该行长于MAXLINE,则会在阅读MAXLINE-1个字符后停止,并在结尾处对'\0'进行预测。

答案 1 :(得分:3)

如果查看此行,则可以看到它在限制之前停止循环两个字符。 i < lim -1

for (i=0; i < lim-1 && (c=getchar())!=EOF && c!='\n'; ++i)

如果char是\n,则附加它,所以0-Byte正好在这种情况下的极限,如果该行正好比限制短一个字节(这是正确的,因为0 -Byte也包括在内。)

答案 2 :(得分:2)

不,我认为它很干净。

请注意,自从本书编写完成以来,POSIX已经将getline()函数标准化为一个完全不同的界面;这可能会引起一些悲伤,但可以通过从K&amp; R重命名该功能来解决这个问题。

代码是:

int getline(char s[],int lim)
{
    int c, i;

    for (i = 0; i < lim-1 && (c=getchar()) != EOF && c != '\n'; ++i)
        s[i] = c;
    if (c == '\n') {
        s[i] = c;
        ++i;
    }
    s[i] = '\0';

    return i;
}

让我们考虑两种情况:

  1. 998个字符后跟换行符。
  2. 999个字符后跟换行符。
  3. 在第一种情况下,当读取换行符之前的字符时,i为997,小于999(lim-1),因此getchar()被执行,字符既不是EOF也不是换行符,并且s[997]被赋值,i递增到998.由于i仍小于999,因此读取换行符,并终止循环。由于c是换行符,s[998]被赋予换行符,i递增到999.然后赋值s[i] = '\0';写入元素999,这是安全的。

    第二种情况的分析是类似的。当读取换行符之前的字符时,i为998,小于999,因此执行getchar(),字符既不是EOF也不是换行符,因此分配了s[998],并且i增加到999.由于i不再小于999,循环退出而不读取换行符;由于c不是换行符,因此循环后if的主体不会被执行;然后将null写入s[999],这是安全的。

    如果在换行符之前检测到EOF(因此文件不以换行符结束,并且在技术上不是根据C标准的文本文件),则安全地断开循环而不会溢出缓冲区。

    是否有未涵盖的案例?

    这称为测试边界条件。重要的是测试低于限制(以确保它正常工作)和极限(以确保它处理正常)。大多数情况下,算法不需要在下面进行多个测试,并且在极限下进行一次测试;有时,如果算法在极限的任一侧处理几个数字(例如平均3个单元格),那么你必须在上边界做更多的测试。下边界测试也很重要 - 测试0,1,2 ......非常有价值。

答案 3 :(得分:1)

一般答案

在分配的内存之外读/写是未定义的行为。

在许多情况下,它会导致可怕的Segmentation fault

在某些情况下,由于运气不佳,您可能会离开(例如,因为您访问的实际内存是物理/逻辑上存在的,否则不会使用)。

简单的答案是:不要这样做!! 保护您的代码不会访问越界内存。

C绝不会做任何魔术,比如当你真正要求你分配n+1字节时分配n个字节。

至于你的具体例子

for (i=0; i < lim-1 /* ... */ ; ++i)

这不会真正增加ilim,因为条件确保i小于lim-1,所以一旦达到lim-1 }(它仍然是s[]中的有效索引)它将停止for - 循环..