Scala Parser有时会跳过空白,有时却不会

时间:2012-05-30 04:52:44

标签: parsing scala

我有一个可用的Scala解析器,但解决方案并不像我想的那样干净。问题是某些产品必须将空格视为令牌的一部分,但“更高级别”的产品应该能够忽略/跳过空白。

如果我使用扩展低级解析器的典型scala解析器模式,那么skipWhitespace设置将被继承,并且事情会很快变得混乱。

我想我最好不使用extends方法,而是在更高级别的解析器类中有一个低级解析器的实例 - 但是我不知道如何使这个工作,所以每个实例只会看到一个输入字符流。

这是最低级解析器的一部分 -

class VulgarFractionParser extends RegexParsers  {
  override type Elem = Char

 override val whiteSpace = "".r

然后我将其扩展为

class NumberParser extends VulgarFractionParser with Positional {

但是在这一点上,NumberParser必须像FractionParser一样显式处理空格。对于NumberParser,它仍然非常容易管理 - 但是在下一级别我真的希望能够定义使用空格作为分隔符的产品,就像普通的regexParser一样。

一个例子是:

IBM 33.33/ 1200.00
or
IBM 33.33/33.50 1200.00

第二个值有时会有两个部分用“/”分隔,有时只有一个部分在斜杠之后没有任何内容(甚至根本不包含斜杠)。

   def bidOrAskPrice = ("$"?) ~> (bidOrAskPrice1 | bidOrAskPrice2 | bidOrAskPrice3) 

   def bidOrAskPrice1 = number ~ ("/".r) ~ number ~ (SPACES) ^^ { 
     case a ~ slash ~ b ~ sp1    => BidOrAsk(a,Some(b))
  }
  def bidOrAskPrice2 = (number ~ "/" ~ (SPACES)) ^^ { case a ~ slash ~ sp => BidOrAsk(a,None) }
   def bidOrAskPrice3 = (number ~ (SPACES?)) ^^ { case a ~ sp => BidOrAsk(a , None)}

2 个答案:

答案 0 :(得分:3)

一种解决方案是覆盖handleWhiteSpace函数并激活在扩展类中使用var值跳过空格。

您可以在此处查看RegexParsers的代码:   https://github.com/scala/scala/blob/v2.9.2/src/library/scala/util/parsing/combinator/RegexParsers.scala

答案 1 :(得分:2)

将第一个解析器转换为令牌解析器(实际上是词法分析器)并使第二个解析器读取而不是普通Char是不是更有意义?