Question

关于Scalas解析器组合器和递归解析，我有一个棘手的问题（至少在我看来）。我目前正在构建一个小解析器，它应该能够解析PL / 1结构，如下所示：

  dcl 1 data,
    3 subData,
      5 tmp char(15),
      5 tmp1 char(15),
    3 subData2,
      5 tmp2 char(10),
      5 tmp3 char(5);

在这种情况下，我想按如下方式构建AST：

Record(data)  -> (Record(subData),Record(subData2))

  Record(subData) -> (Char(tmp),Char(tmp1))

  Record(subData2) -> (Char(tmp2),Char(tmp3))

意味着父元素应该连接到它的子元素。在我的世界中，这应该以某种方式导致递归解析器，但是我的问题是如何控制何时停止在子层中下降。例如，当解析“3子数据”记录结构时，它应当在命中本身不低的级别数时停止，在这种情况下是行“3 subData2”。

有人可以帮助解决这个问题，或者指出我的方向。我目前的解决方案是解析一个未连接的结构后解决这个问题。

提前致谢。

关心Stefan

Answer 1

基本上你只需要Parser.into（它有一个别名>>），它会创建一个基于当前结果的解析器组合器。

我为你准备了一个简单的REPLable示例

import util.parsing.combinator.RegexParsers

case class Record(data: String, children: List[Record])

object RecordParser extends RegexParsers {
  override def skipWhitespace = false

  def ws = "\\s*".r
  def numberGT(min: Int) = "\\d+".r ^^ {  _.toInt } ^? {
    case i if i > min => i
  }

  def subData(n: Int): Parser[Record] = ws ~> numberGT(n) ~ ws ~ ".*".r <~ "\n" >> {
    case sub ~ _ ~ data => rep(subData(sub)) ^^ { new Record(data, _) }
  }
}

val testData = """
1 data
 2 subdata
  3 child1
  3 child2
 2 sub2
"""

RecordParser.parse(RecordParser.subData(0),test)
res7: RecordParser.ParseResult[Record] = [7.1] parsed: Record(data,List(Record(subdata,List(Record(child1,List()), Record(child2,List()))), Record(sub2,List())))

基于级别编号的递归解析

1 个答案: