我知道一般来说,无上下文语法是否明确是不可判定的。但是,这并不意味着无法为无上下文语法的子集决定这一点。
语法用于将输入文本转换为解析树。如果语法可以为给定的输入生成多个解析树,则该语法是不明确的。
LR解析器算法首先将语法转换为LR解析器表。然后,它使用LR解析器自动机使用LR解析器表将给定输入流处理为解析树。第一步通常由解析器生成器完成,而第二步则针对每个解析操作执行。
考虑LR解析器表构造算法construct(G) = T | error
。该算法接收无上下文语法G
。如果表构造成功,则返回无冲突的LR解析器表T
。如果表构造失败,则返回错误。这种算法的示例是SLR,LALR和CLR。算法失败的典型示例是shift-reduce和reduce-reduce冲突。
对于有限输入流和无冲突LR解析器表,LR解析器自动机可以确定性地从给定输入流导出一个解析树,或者如果输入流与语法不匹配则返回错误。解析步骤可以形式化为parse(T, I) = O | error
,其中T
是无冲突的LR解析表,I
是令牌的输入流,O
是单个解析树。如果输入流与语法不匹配,则返回错误。
总结我的理解上面的陈述是任何可以某种方式转换为无冲突的LR解析器表的语法都是明确的。但是,如果算法返回错误,则这并不意味着关于语法是否模糊的任何陈述。因此,LR表构造算法半决定无上下文语法的子集是否是明确的。这是对的吗?
以下是我的结论可能落空的一些步骤:
据我所知,对于常见的LR表构造算法,上述情况都不适用。
我无法找到关于此的明确陈述,所以我非常感谢一个解释以及一个参考,其中讨论并明确回答了这个问题。
我认为这个问题在设计编程语言时非常重要,因为如果我的结论是正确的,LR解析器可以确保用该语言编写的每个程序都可以正确解析。还有其他方法可以确保语法是明确的吗?
答案 0 :(得分:4)
如果可以为语法生成LR(k)解析器,那么语法肯定是明确的。 LR(k)算法是确定性的;它总是会终止,无论是错误还是正确的解析自动机。 (类似地,对于SLR(k)和LALR(k)解析器。)
所以你是对的:如果LR(k)解析表生成算法成功终止,那么语法是明确的,但如果它以错误终止,语法可能是明确的。
我不知道如何将其推广到"任何" LR表生成算法,因为声称是这样的算法可能是不正确的或非终止的。但对于标准算法,它肯定是正确的。
对于正式证明,你可以参考S. Sippu和E. Soisalon-Soininen(Springer-Verlag,1990)的经典教科书解析理论的第二卷。