我刚开始学习编程。这是我的第一篇文章。我正在读Kernighan和Ritchie的一本书“C Programming Language”,我遇到了一个我不理解的例子(第1.9节,第30页)。
此程序将文本作为输入,确定最长行并打印它。 声明了Char数组行[MAXLINE],其中MAXLINE为1000.这应该意味着该数组的最后一个元素的索引为MAXLINE-1,即999。 但是,如果你看一下函数getline,它是作为参数传递line []数组(并且MAXLINE为lim),看来如果用户输入是一个长于MAXLINE的行,我将递增直到i = lim,是,我= MAXLINE。因此,语句行[i] ='\ 0'将为行[MAXLINE] ='\ 0'。
这对我来说不对 - 如果行[]的大小是MAXLINE,我们如何写入行[MAXLINE]位置。它不会写入阵列外的位置吗?
我能想到的唯一解释是,当声明char数组[size]时,C语言实际上创建了char数组[size + 1]数组,其中最后一个元素是为NULL字符保留的。如果是这样,这很令人困惑,书中没有提到。任何人都可以证实这一点,或解释发生了什么?
#include <stdio.h>
#define MAXLINE 1000 /* maximum input line length */
int getline(char line[], int maxline);
void copy(char to[], char from[]);
/* print the longest input line */
main()
{
int len; /* current line length */
int max; /* maximum length seen so far */
char line[MAXLINE]; /* current input line */
char longest[MAXLINE]; /* longest line saved here */
max = 0;
while ((len = getline(line, MAXLINE)) > 0)
if (len > max) {
max = len;
copy(longest, line);
}
if (max > 0) /* there was a line */
printf("%s", longest);
return 0;
}
/* getline: read a line into s, return length */
int getline(char s[],int lim)
{
int c, i;
for (i=0; i < lim-1 && (c=getchar())!=EOF && c!='\n'; ++i)
s[i] = c;
if (c == '\n') {
s[i] = c;
++i;
}
s[i] = '\0';
return i;
}
/* copy: copy 'from' into 'to'; assume to is big enough */
void copy(char to[], char from[])
{
int i;
i = 0;
while ((to[i] = from[i]) != '\0')
++i;
}
答案 0 :(得分:3)
此for
循环似乎正在getline
中进行阅读:
for (i=0; i < lim-1 && (c=getchar())!=EOF && c!='\n'; ++i)
s[i] = c;
看起来i
会递增,直到达到lim - 1
,而不是lim
(如果你说话的话lim
等于MAXLINE
关于)。因此,如果该行长于MAXLINE
,则会在阅读MAXLINE-1
个字符后停止,并在结尾处对'\0'
进行预测。
答案 1 :(得分:3)
如果查看此行,则可以看到它在限制之前停止循环两个字符。 i < lim -1
for (i=0; i < lim-1 && (c=getchar())!=EOF && c!='\n'; ++i)
如果char是\n
,则附加它,所以0-Byte正好在这种情况下的极限,如果该行正好比限制短一个字节(这是正确的,因为0 -Byte也包括在内。)
答案 2 :(得分:2)
不,我认为它很干净。
请注意,自从本书编写完成以来,POSIX已经将getline()
函数标准化为一个完全不同的界面;这可能会引起一些悲伤,但可以通过从K&amp; R重命名该功能来解决这个问题。
代码是:
int getline(char s[],int lim)
{
int c, i;
for (i = 0; i < lim-1 && (c=getchar()) != EOF && c != '\n'; ++i)
s[i] = c;
if (c == '\n') {
s[i] = c;
++i;
}
s[i] = '\0';
return i;
}
让我们考虑两种情况:
在第一种情况下,当读取换行符之前的字符时,i
为997,小于999(lim-1
),因此getchar()
被执行,字符既不是EOF也不是换行符,并且s[997]
被赋值,i
递增到998.由于i
仍小于999,因此读取换行符,并终止循环。由于c
是换行符,s[998]
被赋予换行符,i
递增到999.然后赋值s[i] = '\0';
写入元素999,这是安全的。
第二种情况的分析是类似的。当读取换行符之前的字符时,i
为998,小于999,因此执行getchar()
,字符既不是EOF也不是换行符,因此分配了s[998]
,并且i
增加到999.由于i
不再小于999,循环退出而不读取换行符;由于c
不是换行符,因此循环后if
的主体不会被执行;然后将null写入s[999]
,这是安全的。
如果在换行符之前检测到EOF(因此文件不以换行符结束,并且在技术上不是根据C标准的文本文件),则安全地断开循环而不会溢出缓冲区。
是否有未涵盖的案例?
这称为测试边界条件。重要的是测试低于限制(以确保它正常工作)和极限(以确保它处理正常)。大多数情况下,算法不需要在下面进行多个测试,并且在极限下进行一次测试;有时,如果算法在极限的任一侧处理几个数字(例如平均3个单元格),那么你必须在上边界做更多的测试。下边界测试也很重要 - 测试0,1,2 ......非常有价值。
答案 3 :(得分:1)
在分配的内存之外读/写是未定义的行为。
在许多情况下,它会导致可怕的Segmentation fault
。
在某些情况下,由于运气不佳,您可能会离开(例如,因为您访问的实际内存是物理/逻辑上存在的,否则不会使用)。
简单的答案是:不要这样做!! 保护您的代码不会访问越界内存。
C绝不会做任何魔术,比如当你真正要求你分配n+1
字节时分配n
个字节。
for (i=0; i < lim-1 /* ... */ ; ++i)
这不会真正增加i
到lim
,因为条件确保i
小于lim-1
,所以一旦达到lim-1
}(它仍然是s[]
中的有效索引)它将停止for
- 循环..