Question

我有一个可用的Scala解析器，但解决方案并不像我想的那样干净。问题是某些产品必须将空格视为令牌的一部分，但“更高级别”的产品应该能够忽略/跳过空白。

如果我使用扩展低级解析器的典型scala解析器模式，那么skipWhitespace设置将被继承，并且事情会很快变得混乱。

我想我最好不使用extends方法，而是在更高级别的解析器类中有一个低级解析器的实例 - 但是我不知道如何使这个工作，所以每个实例只会看到一个输入字符流。

这是最低级解析器的一部分 -

class VulgarFractionParser extends RegexParsers  {
  override type Elem = Char

 override val whiteSpace = "".r

然后我将其扩展为

class NumberParser extends VulgarFractionParser with Positional {

但是在这一点上，NumberParser必须像FractionParser一样显式处理空格。对于NumberParser，它仍然非常容易管理 - 但是在下一级别我真的希望能够定义做使用空格作为分隔符的产品，就像普通的regexParser一样。

一个例子是：

IBM 33.33/ 1200.00
or
IBM 33.33/33.50 1200.00

第二个值有时会有两个部分用“/”分隔，有时只有一个部分在斜杠之后没有任何内容（甚至根本不包含斜杠）。

   def bidOrAskPrice = ("$"?) ~> (bidOrAskPrice1 | bidOrAskPrice2 | bidOrAskPrice3) 

   def bidOrAskPrice1 = number ~ ("/".r) ~ number ~ (SPACES) ^^ { 
     case a ~ slash ~ b ~ sp1    => BidOrAsk(a,Some(b))
  }
  def bidOrAskPrice2 = (number ~ "/" ~ (SPACES)) ^^ { case a ~ slash ~ sp => BidOrAsk(a,None) }
   def bidOrAskPrice3 = (number ~ (SPACES?)) ^^ { case a ~ sp => BidOrAsk(a , None)}

Answer 1

一种解决方案是覆盖handleWhiteSpace函数并激活在扩展类中使用var值跳过空格。

您可以在此处查看RegexParsers的代码： https://github.com/scala/scala/blob/v2.9.2/src/library/scala/util/parsing/combinator/RegexParsers.scala

Answer 2

将第一个解析器转换为令牌解析器（实际上是词法分析器）并使第二个解析器读取而不是普通Char是不是更有意义？

Scala Parser有时会跳过空白，有时却不会

2 个答案: