只需查看我教科书中的单词频率计数程序,我就可以了 理解一些细分有点麻烦。
我得到了函数的一般要点,我们从stdin得到一个单词并返回 如果我们找到一个单词,则为1,否则为0。
现在,if (strchr(wordChars,ch)) break;
这条线只是说,"如果我们是char
从stdin中抓取是我们打破循环的字母表的一部分?
关注,*c++ = ch;
此行让我感到困惑,这是第一个字符
到字符串的第二个元素?你为什么要这样做?
while ((ch = getchar()) != EOF) {
ch = tolower(ch);
if (!strchr(wordChars,ch)) break;
*c++ = ch;
这是功能的核心,是吗?我们在哪里形成实际的词。也,
if (c == buf) return 0;
我假设这条线是什么时候捕捉的
读取非字母输入。
这里的语法令人困惑,是\'一个人物?在我看来,这个 字符串的元素尚未初始化。如果我们离开那个, 其余的代码是我们将单词转换为元素的地方,这个 对我来说真的没有意义。
if (buf[0] == '\'') {
for (c = buf+1; *c != '\0'; c++)
*(c-1) = *c;
*(c-1) = '\0';
}
接下来,不是这个访问和替换 这个词的最后一个字母?这对我来说很有意义 如果strlen包含空字符,但它不对吗?
n = strlen(buf)-1;
我想我想摆脱这个问题的真正原因是' \''是为了传达。
感谢您的帮助!**
int getWord(char *buf){
int ch, n;
char *c = buf;
const char *wordChars = "abcdefghijklmnopqrstuvwxyz'";
while ((ch = getchar()) != EOF) {
ch = tolower(ch);
if (strchr(wordChars,ch)) break;
}
if (ch == EOF) return 0;
*c++ = ch;
while ((ch = getchar()) != EOF) {
ch = tolower(ch);
if (!strchr(wordChars,ch)) break;
*c++ = ch;
}
*c = '\0';
if (c == buf) return 0;
if (buf[0] == '\'') {
for (c = buf+1; *c != '\0'; c++)
*(c-1) = *c;
*(c-1) = '\0';
}
n = strlen(buf)-1;
if (buf[n] == '\'') {
buf[n] = '\0';
}
else if (buf[n-1] == '\'' && buf[n] == 's') {
buf[n-1] = '\0';
}
return 1;
}
答案 0 :(得分:3)
要解决此代码段:
if (strchr(wordChars,ch)) break;
你的猜测是正确的。这意味着如果在字符串wordChars中找到字符ch,则strchr()返回指向字符位置的指针。在这种情况下,上面的代码段可以简化为:
if (!NULL) break;
因为返回了非空指针。该语句的计算结果为true(因为NULL == 0计算结果为false,而!false计算结果为true),并且命中了break语句。
要解决有关反斜杠的问题,请使用反斜杠' \' C中的字符表示escape sequence。从链接:
转义序列是一个字符序列,在字符或字符串文字中使用时不会表示自身,但会转换为另一个字符或字符序列,可能很难或无法直接表示。
在这种情况下,' \ 0'表示以null结尾的字符串的结尾,称为空字符。
答案 1 :(得分:3)
Now, is 'if (strchr(wordChars,ch)) break;' this line just saying, "if the char we grabbed from stdin is part of the alphabet we're breaking the loop?
是。从documentation:“如果找不到该字符,则该函数返回一个空指针。”因此,如果在ch
中找不到wordChars
,则strchr
会返回NULL
,这相当于0
。
Following, '*c++ = ch;' this line confuses me, is this setting the first character to the second element of the string? Why would you want to do this?
没有。这会将第一个字符设置为字符串的 first 元素,然后会增加字符串指针。 (从技术上讲,这不是很正确 - 真正发生的事情是指针正在递增,但随后操作符返回旧指针,这就是正在设置的内容。)这种情况反复发生,写作新的ch
到字符串的末尾。
Also, 'if (c == buf) return 0;' I'm assuming this line is to catch when nothing or a non-alphabetic input is read.
这是正确的。
The syntax here is confusing, is \' a character? It would seem to me that this element of the string hasn't been initialized yet.
如果您键入'''
,编译器会怎么想?它会看到''
,这是一个无效的字符(因为你在撇号之间没有任何东西),然后是另一个'
,它将保持不匹配。 \
是转义字符。 \'
基本上是指“编译器,不要将此撇号视为字符的结束分隔符 - 将其视为 字符!”
If we leave that, the rest of the code is where we shift the word we got back an element, this doesn't really make sense to me.
基本上你在这里做的是从字符#1一直到单词的结尾,并将字符一个接一个地移回一个索引。然后,您必须使用\0
对字符串进行空值终止。 (请注意,此处的\
也是转义字符。您可能需要查看以查看更多示例。Here是参考。)
Next, isn't this accessing and replacing the last letter of the word? It would make sense to me if strlen include the null character, but it doesn't right?
替换单词的最后一个字符。具体来说,它将使用null终止符替换它,从而有效地删除最后一个字符。基本上,这段和最后一段代码只是从单词的开头和结尾删除了一个撇号。
我希望这有帮助!请再问你有什么问题! :)