我正在尝试使用解析器组合器在Scala中编写一个SemVer(http://semver.org)解析器,作为对它们的一种熟悉。
这是我目前的代码:
case class SemVer(major: Int, minor: Int, patch: Int, prerelease: Option[List[String]], metadata: Option[List[String]]) {
override def toString = s"$major.$minor.$patch" + prerelease.map("-" + _.mkString(".")).getOrElse("") + metadata.map("+" + _.mkString("."))
}
class VersionParser extends RegexParsers {
def number: Parser[Int] = """(0|[1-9]\d*)""".r ^^ (_.toInt)
def separator: Parser[String] = """\.""".r
def prereleaseSeparator: Parser[String] = """-""".r
def metadataSeparator: Parser[String] = """\+""".r
def identifier: Parser[String] = """([0-9A-Za-z-])+""".r ^^ (_.toString)
def prereleaseIdentifiers: Parser[List[String]] = (number | identifier) ~ rep(separator ~> (number | identifier)) ^^ {
case first ~ rest => List(first.toString) ++ rest.map(_.toString)
}
def metadataIdentifiers: Parser[List[String]] = identifier ~ rep(separator ~> identifier) ^^ {
case first ~ rest => List(first.toString) ++ rest.map(_.toString)
}
}
我想知道我应该如何解析预发布部分的标识符,因为它不允许数字标识符中的前导零,当我尝试使用我当前的解析器前导零(例如在“01.2.3”中)解析时成为包含元素0的列表。
更一般地说,我应该如何检测到字符串不符合SemVer规范并因此强制失败?
答案 0 :(得分:1)
经过一些游戏和搜索之后,我发现问题在于我调用parse
方法而不是parseAll
方法。由于parse
基本上会尽可能多地进行解析,因此无法再解析,因此它可以接受部分正确的字符串。使用parseAll
强制解析所有输入,如果解析停止后仍有输入,则失败。这正是我所寻找的。 p>
答案 1 :(得分:0)
为了完整起见,我会添加
def version = number ~ (separator ~> number) ~ (separator ~> number) ~ ((prereleaseSeparator ~> prereleaseIdentifiers)?) ~ ((metadataSeparator ~> metadataIdentifiers)?) ^^ {
case major ~ minor ~ patch ~ prerelease ~ metadata => SemVer(major, minor, patch, prerelease, metadata)
}
VersionParser的方法