解析Scala中的SemVer

时间:2015-02-10 17:05:04

标签: scala parsing parser-combinators semantic-versioning

我正在尝试使用解析器组合器在Scala中编写一个SemVer(http://semver.org)解析器,作为对它们的一种熟悉。

这是我目前的代码:

case class SemVer(major: Int, minor: Int, patch: Int, prerelease: Option[List[String]], metadata: Option[List[String]]) {
  override def toString = s"$major.$minor.$patch" + prerelease.map("-" + _.mkString(".")).getOrElse("") + metadata.map("+" + _.mkString("."))
}

class VersionParser extends RegexParsers {
  def number: Parser[Int] = """(0|[1-9]\d*)""".r ^^ (_.toInt)
  def separator: Parser[String] = """\.""".r
  def prereleaseSeparator: Parser[String] = """-""".r
  def metadataSeparator: Parser[String] = """\+""".r
  def identifier: Parser[String] = """([0-9A-Za-z-])+""".r ^^ (_.toString)

  def prereleaseIdentifiers: Parser[List[String]] = (number | identifier) ~ rep(separator ~> (number | identifier)) ^^ {
    case first ~ rest => List(first.toString) ++ rest.map(_.toString)
  }

  def metadataIdentifiers: Parser[List[String]] = identifier ~ rep(separator ~> identifier) ^^ {
    case first ~ rest => List(first.toString) ++ rest.map(_.toString)
  }
}

我想知道我应该如何解析预发布部分的标识符,因为它不允许数字标识符中的前导零,当我尝试使用我当前的解析器前导零(例如在“01.2.3”中)解析时成为包含元素0的列表。

更一般地说,我应该如何检测到字符串不符合SemVer规范并因此强制失败?

2 个答案:

答案 0 :(得分:1)

经过一些游戏和搜索之后,我发现问题在于我调用parse方法而不是parseAll方法。由于parse基本上会尽可能多地进行解析,因此无法再解析,因此它可以接受部分正确的字符串。使用parseAll强制解析所有输入,如果解析停止后仍有输入,则失败。这正是我所寻找的。

答案 1 :(得分:0)

为了完整起见,我会添加

def version = number ~ (separator ~> number) ~ (separator ~> number) ~ ((prereleaseSeparator ~> prereleaseIdentifiers)?) ~ ((metadataSeparator ~> metadataIdentifiers)?) ^^ {
  case major ~ minor ~ patch ~ prerelease ~ metadata => SemVer(major, minor, patch, prerelease, metadata)
}

VersionParser的方法