Question

我刚刚开始阅读The C Programming Language并且我无法理解其中的一部分。以下是第24页的摘录：

#include<stdio.h>

/*countdigits,whitespace,others*/

main()
{
  intc,i,nwhite,nother;
  intndigit[10];

  nwhite=nother=0;
  for(i=0;i<10;++i)
      ndigit[i]=0;

  while((c=getchar())!=EOF)
      if(c>='0'&&c<='9')
          ++ndigit[c-'0']; //THIS IS THE LINE I AM WONDERING ABOUT
      else if(c==''||c=='\n'||c=='\t')
          ++nwhite;
      else
          ++nother;

  printf("digits=");
  for(i=0;i<10;++i)
      printf("%d",ndigit[i]);
  printf(",whitespace=%d,other=%d\n",
      nwhite,nother);
}
此程序的输出本身就是
digits=9300000001,whitespace=123,other=345
声明
intndigit[10];
将ndigit声明为10个整数的数组。数组下标总是从C开始为零，因此元素是
ndigit[0], ndigit[ 1], ..., ndigit[9]
这反映在初始化和打印数组的for循环中。下标可以是任何整数表达式，包括整数变量，如i和整数常量。此特定程序依赖于数字的字符表示的属性。例如，测试
if(c>='0'&&c<='9')
确定c中的字符是否为数字。如果是，则该数字的数值为
c-'0'`
仅当'0'，'1'，...，'9'具有连续增加的值时才有效。幸运的是，对于所有字符集都是如此。根据定义，字符只是小整数，因此char变量和常量与算术表达式中的int相同。这很自然方便;例如
c-'0'
是一个整数表达式，其值介于0和9之间，对应于存储在c中的字符“0”到“9”，因此是数组ndigit的有效下标。

我无法理解的部分是-'0'部分在表达式c-'0'中是必要的原因。如果一个字符是作者所说的小整数，并且数字字符对应于它们的数值，则-'0'做什么？

Answer 1

数字字符与其数字值不对应。它们对应于它们的编码值（在本例中为ASCII）。

IIRC，ascii'0'是值48.而且，幸运的是，对于此示例和大多数字符集，“0”到“9”的值按字符集顺序存储。

因此，从任何ASCII数字中减去“0”的ASCII值会返回其“0”的“真实”值。

Answer 2

字符的数值是（在大多数系统上）其ASCII值。 ASCII值“0”为48，“1”为49，等等。

通过从字符'0'的值减去48变为0，'1'变为1，等等。通过将其写为c - '0'，您实际上不需要知道'0的ASCII值是什么'是（或系统正在使用ASCII - 它可能正在使用EBCDIC）。唯一重要的是值是连续增加的整数。

Answer 3

它从键盘上'0'键的ASCII码转换为零值。

如果你做了int x ='0'+'0'，结果就不会为零。

Answer 4

在大多数字符编码中，所有数字都连续放在字符集中。例如，在ASCII中，它们以'0' 0x30开头'1'为0x31，'2'为0x32，等等。如果您想要给定数字的数值，您可以从中减去'0'并获得正确的值。使用'0'而不是特定值的优点是，您的代码可以轻松地移植到其他字符集。

Answer 5

如果您通过字符访问字符串，您将获得ASCII值，即使字符恰好是数字。

幸运的是，设计该字符表的人确保0到9的字符是连续的，因此您可以通过减去ASCII值“0”简单地从ASCII转换为数字。

这就是代码的作用。我不得不承认，当你第一次看到它时会让人感到困惑，但这不是火箭科学。

ASCII字符值“0”为48，“1”为49，“2”为50，依此类推。

这里有一个很好的ASCII图表参考：

http://www.sciencelobby.com/ascii-table/images/ascii-table1.gif

C中数字字符的数字值

5 个答案: