Scala解析器组合器:按行解析

时间:2013-10-12 23:00:51

标签: parsing scala parser-combinators

使用Scala解析器组合器库是否可以按行解析,而不是字符解析?我希望我的自定义解析器具有签名

(in: Reader[String]) => ParserResult[T]

这样String in.first 就是一行文字和 in.rest - 剩余的行。

我假设我需要将 Parsers 子类化,并将 Elem 类型定义为 String 。然后实现 Reader [String] 将输入拆分为行。我想知道这是正确的做法吗?还有其他解决方案吗?

1 个答案:

答案 0 :(得分:0)

以下代码执行此操作:

import scala.util.parsing.combinator.Parsers
import scala.util.parsing.input.{Position, Reader}

object Main {
  def main(args: Array[String]): Unit = CVParser("one\ntwo\nthree")
}

object CVParser {
  def apply(in: String): Any = impl.parse(in)

  private object impl extends Parsers {
    override type Elem = String

    def parse(in: String): ParseResult[String~String~String] = {
      val reader = new ByLineReader(in.split(System.lineSeparator).toList, 1)
      grammar(reader)
    }

    // private

    private val grammar = SampleParser ~ SampleParser ~ SampleParser

    private class ByLineReader(lines: List[String], lineNo: Int) extends Reader[String] {
      override def first: String = lines.headOption getOrElse ""
      override def rest: Reader[String] =
        if (!lines.isEmpty) new ByLineReader(lines.tail, lineNo + 1)
        else new ByLineReader(lines, lineNo)
      override def pos: Position = new Position {
        def line: Int = lineNo
        def column: Int = 0
        def lineContents: String = first
      }
      override def atEnd: Boolean = lines.size == 1
    }

    private object SampleParser extends Parser[String] {
      def apply(in: Input): ParseResult[String] = {
        println(in.first + "\n---------")
        Success(in.first, in.rest)
      }
    }
  }
}

输出:

one
---------
two
---------
three
---------

现在接受一行文本的新解析器可以使用常用的解析器组合器编写和组合,例如〜,〜>,<〜,|,rep等。