基于级别编号的递归解析

时间:2011-12-30 09:54:57

标签: parsing scala abstract-syntax-tree parser-combinators

关于Scalas解析器组合器和递归解析,我有一个棘手的问题(至少在我看来)。我目前正在构建一个小解析器,它应该能够解析PL / 1结构,如下所示:

  dcl 1 data,
    3 subData,
      5 tmp char(15),
      5 tmp1 char(15),
    3 subData2,
      5 tmp2 char(10),
      5 tmp3 char(5);

在这种情况下,我想按如下方式构建AST:

Record(data)  -> (Record(subData),Record(subData2))

  Record(subData) -> (Char(tmp),Char(tmp1))

  Record(subData2) -> (Char(tmp2),Char(tmp3))  

意味着父元素应该连接到它的子元素。在我的世界中,这应该以某种方式导致递归解析器,但是我的问题是如何控制何时停止在子层中下降。例如,当解析“3子数据”记录结构时,它应当在命中本身不低的级别数时停止,在这种情况下是行“3 subData2”。

有人可以帮助解决这个问题,或者指出我的方向。 我目前的解决方案是解析一个未连接的结构后解决这个问题。

提前致谢。

关心Stefan

1 个答案:

答案 0 :(得分:3)

基本上你只需要Parser.into(它有一个别名>>),它会创建一个基于当前结果的解析器组合器。

我为你准备了一个简单的REPLable示例

import util.parsing.combinator.RegexParsers

case class Record(data: String, children: List[Record])

object RecordParser extends RegexParsers {
  override def skipWhitespace = false

  def ws = "\\s*".r
  def numberGT(min: Int) = "\\d+".r ^^ {  _.toInt } ^? {
    case i if i > min => i
  }

  def subData(n: Int): Parser[Record] = ws ~> numberGT(n) ~ ws ~ ".*".r <~ "\n" >> {
    case sub ~ _ ~ data => rep(subData(sub)) ^^ { new Record(data, _) }
  }
}

val testData = """
1 data
 2 subdata
  3 child1
  3 child2
 2 sub2
"""

RecordParser.parse(RecordParser.subData(0),test)
res7: RecordParser.ParseResult[Record] = [7.1] parsed: Record(data,List(Record(subdata,List(Record(child1,List()), Record(child2,List()))), Record(sub2,List())))