我有一个可用的Scala解析器,但解决方案并不像我想的那样干净。问题是某些产品必须将空格视为令牌的一部分,但“更高级别”的产品应该能够忽略/跳过空白。
如果我使用扩展低级解析器的典型scala解析器模式,那么skipWhitespace设置将被继承,并且事情会很快变得混乱。
我想我最好不使用extends方法,而是在更高级别的解析器类中有一个低级解析器的实例 - 但是我不知道如何使这个工作,所以每个实例只会看到一个输入字符流。
这是最低级解析器的一部分 -
class VulgarFractionParser extends RegexParsers {
override type Elem = Char
override val whiteSpace = "".r
然后我将其扩展为
class NumberParser extends VulgarFractionParser with Positional {
但是在这一点上,NumberParser必须像FractionParser一样显式处理空格。对于NumberParser,它仍然非常容易管理 - 但是在下一级别我真的希望能够定义做使用空格作为分隔符的产品,就像普通的regexParser一样。
一个例子是:
IBM 33.33/ 1200.00
or
IBM 33.33/33.50 1200.00
第二个值有时会有两个部分用“/”分隔,有时只有一个部分在斜杠之后没有任何内容(甚至根本不包含斜杠)。
def bidOrAskPrice = ("$"?) ~> (bidOrAskPrice1 | bidOrAskPrice2 | bidOrAskPrice3)
def bidOrAskPrice1 = number ~ ("/".r) ~ number ~ (SPACES) ^^ {
case a ~ slash ~ b ~ sp1 => BidOrAsk(a,Some(b))
}
def bidOrAskPrice2 = (number ~ "/" ~ (SPACES)) ^^ { case a ~ slash ~ sp => BidOrAsk(a,None) }
def bidOrAskPrice3 = (number ~ (SPACES?)) ^^ { case a ~ sp => BidOrAsk(a , None)}
答案 0 :(得分:3)
一种解决方案是覆盖handleWhiteSpace函数并激活在扩展类中使用var值跳过空格。
您可以在此处查看RegexParsers的代码: https://github.com/scala/scala/blob/v2.9.2/src/library/scala/util/parsing/combinator/RegexParsers.scala
答案 1 :(得分:2)
将第一个解析器转换为令牌解析器(实际上是词法分析器)并使第二个解析器读取而不是普通Char
是不是更有意义?