使用nom解析骆驼案例字符串

时间:2017-02-12 02:50:20

标签: parsing rust nom

我想使用nom crate将"ParseThis""parseThis"之类的字符串解析为["Parse", "This"]["parse", "this"]之类的字符串向量。

我尝试过的所有尝试都没有返回预期的结果。我可能还不了解如何使用nom中的所有函数。

我试过了:

named!(camel_case<(&str)>, 
       map_res!(
           take_till!(is_not_uppercase),
           std::str::from_utf8));

named!(p_camel_case<&[u8], Vec<&str>>,
       many0!(camel_case));

但是p_camel_case只返回一个Error(Many0)来解析一个以大写字母开头的字符串,并解析一个以小写字母开头的字符串,它返回Done但是有一个空字符串结果。

如何告诉nom我想要解析字符串,用大写字母分隔(假设可以有一个大写或小写的字母)?

1 个答案:

答案 0 :(得分:3)

您正在寻找以任何字符开头的内容,后跟一些非大写字母。作为正则表达式,这看起来类似于.[a-z]*。直接翻译为nom,其中包括:

#[macro_use]
extern crate nom;

use nom::anychar;

fn is_uppercase(a: u8) -> bool { (a as char).is_uppercase() }

named!(char_and_more_char<()>, do_parse!(
    anychar >>
    take_till!(is_uppercase) >>
    ()
));

named!(camel_case<(&str)>, map_res!(recognize!(char_and_more_char), std::str::from_utf8));

named!(p_camel_case<&[u8], Vec<&str>>, many0!(camel_case));

fn main() {
    println!("{:?}", p_camel_case(b"helloWorld"));
    // Done([], ["hello", "World"])

    println!("{:?}", p_camel_case(b"HelloWorld"));
    // Done([], ["Hello", "World"])
}

当然,您可能需要注意实际匹配正确的非ASCII字节,但您应该能够以直接的方式扩展它。