Question

我正在尝试使用解析器组合器在Scala中编写一个SemVer（http://semver.org）解析器，作为对它们的一种熟悉。

这是我目前的代码：

case class SemVer(major: Int, minor: Int, patch: Int, prerelease: Option[List[String]], metadata: Option[List[String]]) {
  override def toString = s"$major.$minor.$patch" + prerelease.map("-" + _.mkString(".")).getOrElse("") + metadata.map("+" + _.mkString("."))
}

class VersionParser extends RegexParsers {
  def number: Parser[Int] = """(0|[1-9]\d*)""".r ^^ (_.toInt)
  def separator: Parser[String] = """\.""".r
  def prereleaseSeparator: Parser[String] = """-""".r
  def metadataSeparator: Parser[String] = """\+""".r
  def identifier: Parser[String] = """([0-9A-Za-z-])+""".r ^^ (_.toString)

  def prereleaseIdentifiers: Parser[List[String]] = (number | identifier) ~ rep(separator ~> (number | identifier)) ^^ {
    case first ~ rest => List(first.toString) ++ rest.map(_.toString)
  }

  def metadataIdentifiers: Parser[List[String]] = identifier ~ rep(separator ~> identifier) ^^ {
    case first ~ rest => List(first.toString) ++ rest.map(_.toString)
  }
}

我想知道我应该如何解析预发布部分的标识符，因为它不允许数字标识符中的前导零，当我尝试使用我当前的解析器前导零（例如在“01.2.3”中）解析时成为包含元素0的列表。

更一般地说，我应该如何检测到字符串不符合SemVer规范并因此强制失败？

Answer 1

经过一些游戏和搜索之后，我发现问题在于我调用parse方法而不是parseAll方法。由于parse基本上会尽可能多地进行解析，因此无法再解析，因此它可以接受部分正确的字符串。使用parseAll强制解析所有输入，如果解析停止后仍有输入，则失败。这正是我所寻找的。

Answer 2

为了完整起见，我会添加

def version = number ~ (separator ~> number) ~ (separator ~> number) ~ ((prereleaseSeparator ~> prereleaseIdentifiers)?) ~ ((metadataSeparator ~> metadataIdentifiers)?) ^^ {
  case major ~ minor ~ patch ~ prerelease ~ metadata => SemVer(major, minor, patch, prerelease, metadata)
}

VersionParser的方法

解析Scala中的SemVer

2 个答案: