使用scala中的解析器组合器创建递归数据结构

时间:2012-12-27 23:25:14

标签: parsing scala tree parser-combinators

我是scala的初学者,正致力于S99尝试学习scala。其中一个问题涉及从字符串转换为树数据结构。我可以“手动”完成它,我也希望看到如何使用Scala的解析器组合库来实现它。

树的数据结构是

sealed abstract class Tree[+T]
case class Node[+T](value: T, left: Tree[T], right: Tree[T]) extends Tree[T] {
  override def toString = "T(" + value.toString + " " + left.toString + " " + right.toString + ")"
}
case object End extends Tree[Nothing] {
  override def toString = "."
}
object Node {
  def apply[T](value: T): Node[T] = Node(value, End, End)
}    

输入应该是一个字符串,如下所示:a(b(d,e),c(,f(g,)))

我可以使用

之类的东西来解析字符串
trait Tree extends JavaTokenParsers{
  def leaf: Parser[Any] = ident
  def child: Parser[Any] = node | leaf | ""
  def node: Parser[Any] = ident~"("~child~","~child~")" | leaf 
}

但是如何使用解析库来构建树?我知道我可以使用^^将某些字符串转换为整数。我的困惑来自于在创建Node实例时需要“知道”左右子树。我怎么能这样做,或者这是我想要做些不同的事情的标志?

我最好采取解析器返回的内容(上面的示例输入为(((((a~()~(((((b~()~d)~,)~e)~)))~,)~(((((c~()~)~,)~(((((f~()~g)~,)~)~)))~)))~))),并基于此构建树,而不是使用^^或{{1}等解析器运算符直接构建树?

1 个答案:

答案 0 :(得分:5)

可以使用^^干净地完成此操作,并且您非常接近:

object TreeParser extends JavaTokenParsers{
  def leaf: Parser[Node[String]] = ident ^^ (Node(_))
  def child: Parser[Tree[String]] = node | leaf | "" ^^ (_ => End)
  def node: Parser[Tree[String]] =
    ident ~ ("(" ~> child) ~ ("," ~> child <~ ")") ^^ {
      case v ~ l ~ r => Node(v, l, r)
    } | leaf
}

现在:

scala> TreeParser.parseAll(TreeParser.node, "a(b(d,e),c(,f(g,)))").get
res0: Tree[String] = T(a T(b T(d . .) T(e . .)) T(c . T(f T(g . .) .)))

在我看来,解决此类问题的最简单方法是使用您想要的结果键入解析器方法,然后使用^^添加适当的映射操作,直到编译器满意为止。