使用nom捕获整个连续匹配的输入

时间:2016-03-30 05:25:58

标签: rust parser-combinators

我希望应用一系列nom解析器并返回匹配的完整&str。我想匹配a+bc+形式的字符串。使用现有的chain! macro我可以非常接近:

named!(aaabccc <&[u8], &str>,
   map_res!(
       chain!(
           a: take_while!(is_a) ~
               tag!("b") ~
               take_while!(is_c) ,
           || {a}
           ),
       from_utf8
   ));

,其中

fn is_a(l: u8) -> bool {
   match l {
       b'a' => true,
       _ => false,
   }
}

fn is_c(l: u8) -> bool {
    match l {
        b'c' => true,
        _ => false,
    }
}

说我们有'aaabccc&#39;作为输入。上面的解析器将匹配输入,但只有&#39; aaa&#39;将被退回。我想做的是返回&#39; aaabccc&#39;,原始输入。

chain!不是正确的宏,但没有其他似乎更正确。最好的方法是什么?

在撰写本文时,我使用了nom 1.2.2和rustc 1.9.0-nightly (a1e29daf1 2016-03-25)

1 个答案:

答案 0 :(得分:3)

好像你想要recognized!

  

如果子解析器成功,则将消耗的输入作为生成值

返回

一个例子:

#[macro_use]
extern crate nom;

use nom::IResult;

fn main() {
    assert_eq!(aaabccc(b"aaabcccddd"), IResult::Done(&b"ddd"[..], "aaabccc"));
}

named!(aaabccc <&[u8], &str>,
   map_res!(
       recognize!(
           chain!(
               take_while!(is_a) ~
               tag!("b") ~
               take_while!(is_c),
               || {}
           )
       ),
       std::str::from_utf8
   )
);

fn is_a(l: u8) -> bool {
   match l {
       b'a' => true,
       _ => false,
   }
}

fn is_c(l: u8) -> bool {
    match l {
        b'c' => true,
        _ => false,
    }
}

如果您不关心值,我不确定chain!是否是组合顺序解析器的最佳方式,但它适用于这种情况。