关于Scalas解析器组合器和递归解析,我有一个棘手的问题(至少在我看来)。我目前正在构建一个小解析器,它应该能够解析PL / 1结构,如下所示:
dcl 1 data,
3 subData,
5 tmp char(15),
5 tmp1 char(15),
3 subData2,
5 tmp2 char(10),
5 tmp3 char(5);
在这种情况下,我想按如下方式构建AST:
Record(data) -> (Record(subData),Record(subData2))
Record(subData) -> (Char(tmp),Char(tmp1))
Record(subData2) -> (Char(tmp2),Char(tmp3))
意味着父元素应该连接到它的子元素。在我的世界中,这应该以某种方式导致递归解析器,但是我的问题是如何控制何时停止在子层中下降。例如,当解析“3子数据”记录结构时,它应当在命中本身不低的级别数时停止,在这种情况下是行“3 subData2”。
有人可以帮助解决这个问题,或者指出我的方向。 我目前的解决方案是解析一个未连接的结构后解决这个问题。
提前致谢。
关心Stefan
答案 0 :(得分:3)
基本上你只需要Parser.into
(它有一个别名>>
),它会创建一个基于当前结果的解析器组合器。
我为你准备了一个简单的REPLable示例
import util.parsing.combinator.RegexParsers
case class Record(data: String, children: List[Record])
object RecordParser extends RegexParsers {
override def skipWhitespace = false
def ws = "\\s*".r
def numberGT(min: Int) = "\\d+".r ^^ { _.toInt } ^? {
case i if i > min => i
}
def subData(n: Int): Parser[Record] = ws ~> numberGT(n) ~ ws ~ ".*".r <~ "\n" >> {
case sub ~ _ ~ data => rep(subData(sub)) ^^ { new Record(data, _) }
}
}
val testData = """
1 data
2 subdata
3 child1
3 child2
2 sub2
"""
RecordParser.parse(RecordParser.subData(0),test)
res7: RecordParser.ParseResult[Record] = [7.1] parsed: Record(data,List(Record(subdata,List(Record(child1,List()), Record(child2,List()))), Record(sub2,List())))