我正在使用功能而不是宏在Nom 5中编写解析器。我的目标是编写一个解析器,以识别完全由大写字符组成的字符串。理想情况下,它将具有与alpha1相同的返回签名。
constant ratio_ceiling : integer := (M + N - 1) / N;
constant ratio_floor : integer := M / N;
尽管可以编译,但我编写的简单单元测试失败:
use nom::{
character::complete::{alpha1, char, line_ending, not_line_ending},
combinator::{cut, map, not, recognize},
error::{context, ParseError, VerboseError},
multi::{many0, many1},
IResult,
};
fn uppercase_char<'a, E: ParseError<&'a str>>(i: &'a str) -> IResult<&'a str, &'a str, E> {
let chars = "ABCDEFGHIJKLMNOPQRSTUVWXYZ";
take_while(move |c| chars.contains(c))(i)
}
// Matches 1 or more consecutive uppercase characters
fn upper1<'a, E: ParseError<&'a str>>(i: &'a str) -> IResult<&'a str, &'a str, E> {
recognize(many1(uppercase_char))(i)
}
失败输出是
#[test]
fn test_upper_string_ok() {
let input_text = "ADAM";
let output = upper1::<VerboseError<&str>>(input_text);
dbg!(&output);
let expected = Ok(("ADAM", ""));
assert_eq!(output, expected);
}
答案 0 :(得分:3)
take_while
可以识别0个或多个字符,因此,像您一样在many1
中使用时,它将首先解析整个"ADAM"
字符串。然后,当many1
再次调用它时,由于take_while
可以识别一个空字符串,它将成功执行,但是many0
和many1
可以防止该错误:如果基础解析器没有消耗任何输入,它们将返回错误。
对于您所需要的,uppercase_char
函数就足够了,不需要recognize
和many1
。尽管您可能希望将take_while
替换为take_while1