应用错误收集

有可能编写一个符合限制2的正则表达式，但这很复杂且容易出错，并且随着关键字的数量而严重缩放（即每次添加新关键字时，您都必须费力地扩展正则表达式更复杂的。）

相反，这个问题通常是通过定义标识符的正则表达式而不考虑关键字并利用lex的规则来解决歧义来解决的，这些规则是这样的：

如果有多个正则表达式可以匹配当前输入，则选择具有最长匹配的正则表达式（这称为最大蒙克规则）。例如，对于输入“ifay”，词法分析器将生成IDENT("ifay")而不是KEYWORD_IF（后跟IDENT("ay")），因为“ifay”是较长的匹配。
如果多个正则表达式生成相同长度的匹配项，则lex将选择其定义在lex文件中首先出现的那个。因此，只要KEYWORD_IF的定义出现在lex文件中IDENTIFIER的定义之前，“if”将被标记为关键字而不是标识符。

因此，只要您将关键字定义放在标识符定义之前，词法分析器就可以根据需要运行，而无需调整标识符规则。