Question

在普通的PEG（解析表达式语法）中，这是一个有效的语法：

values <- number (comma values)*
number <- [0-9]+
comma  <- ','

但是，如果我尝试使用LPeg编写此规则，则该规则的递归性质将失败：

local lpeg   = require'lpeg'

local comma  = lpeg.P(',')
local number = lpeg.R('09')^1
local values = number * (comma * values)^-1
--> bad argument #2 to '?' (lpeg-pattern expected, got nil)

虽然在这个简单的例子中我可以重写规则以不使用递归，但我有一些我不想重写的现有语法。

如何在LPeg中编写自引用规则？

Answer 1

使用grammar。

使用Lua变量，可以逐步定义模式，每个新模式使用先前定义的模式。但是，该技术不允许定义递归模式。对于递归模式，我们需要真正的语法。

LPeg表示带表格的语法，其中每个条目都是规则。

调用lpeg.V（v）创建一个模式，表示语法中带索引v的非终结符（或变量）。因为在评估此函数时语法仍然不存在，结果是对相应规则的开放引用。

当表转换为模式时（通过调用lpeg.P或使用其中需要模式的表），表是固定的。然后更正由lpeg.V（v）创建的每个打开引用以引用表中由v索引的规则。

修复表时，结果是与其初始规则匹配的模式。表中索引为1的条目定义了其初始规则。如果该条目是字符串，则假定它是初始规则的名称。否则，LPeg假定条目1本身是初始规则。

作为一个例子，下面的语法匹配a和b的字符串，它们具有相同数量的a和b：
equalcount = lpeg.P{
  "S";   -- initial rule name
  S = "a" * lpeg.V"B" + "b" * lpeg.V"A" + "",
  A = "a" * lpeg.V"S" + "b" * lpeg.V"A" * lpeg.V"A",
  B = "b" * lpeg.V"S" + "a" * lpeg.V"B" * lpeg.V"B",
} * -1
它等同于标准PEG表示法中的以下语法：
  S <- 'a' B / 'b' A / ''
  A <- 'a' S / 'b' A A
  B <- 'b' S / 'a' B B

Answer 2

我知道这是一个迟到的答案，但这里有一个想法如何反向引用规则

local comma  = lpeg.P(',')
local number = lpeg.R('09')^1
local values = lpeg.P{ lpeg.C(number) * (comma * lpeg.V(1))^-1 }

local t = { values:match('1,10,20,301') }

基本上，原始语法传递给lpeg.P（语法只是一个美化的表），它引用第一个规则而不是名称，即lpeg.V(1)。

示例只是在lpeg.C终端上添加了一个简单的number捕获，并将所有这些结果收集到本地表t中以供进一步使用。（请注意，没有使用lpeg.Ct这不是什么大问题，但仍然是......我猜的样本的一部分。）

创建递归LPeg模式

2 个答案: