为什么预处理器会区分数字和字符标记?

时间:2015-02-25 18:38:16

标签: c++ c compilation token c-preprocessor

根据语言规范,词汇元素的定义如下:

token:
    keyword
    identifier

    constant

    string-literal
    operator
    punctuator

preprocessing-token:
    header-name
    identifier

    pp-number
    character-constant

    string-literal
    operator
    punctuator

    each non-white-space character that cannot be one of the above

为什么预处理令牌级别上的数字和字符之间存在区别,而在令牌级别上,只有常量?我没有看到这种区别的好处。

1 个答案:

答案 0 :(得分:5)

C语法中非终端的名称不是规范性的;它们只是为了描述而存在。只有正确描述行为才是重要的。语法本身不足以描述语言;它需要与文本一起阅读,这对良构的程序施加了进一步的限制。

预处理程序令牌与程序令牌之间没有一对一的关系。存在重叠:预处理器identifier可能是关键字,也可能是各种可定义符号类型之一(包括一些常量和typedef-names)。 pp-number可能是整数或浮点常量,但也可能无效。词汇作品并非全部相互排斥,词汇类别实际应用于程序的子串需要标准文本中描述的程序,而不是正式语法。

字符常量直接从预处理器传递到程序语法中而不进行修改(尽管它们被包含在constant类别中)。如果有关于预处理程序编号的单一注释(例如,如果它们在预处理程序中存活,它们必须可转换为实数数字常量文字)是获得该类别的充分理由。

此外,它会在character-constant的定义中添加pp-number包含哪些内容?你仍然需要两种产品才能描述语言。