我想处理一个包含反斜杠和可转义字符的字符串,就像它们是一个字符一样。
let raw = r#"\""#;
let cooked = raw.process_escape_character_magic();
现在,raw
有2个字符:\
和"
。但是我真正想要的是cooked
,它只有一个字符:"
。
我如何获得cooked
?
我当时正在考虑使用正则表达式,但是我觉得应该有更好的方法。
答案 0 :(得分:2)
我喜欢在Rust中使用迭代器,并且我认为这是一个完美的用例:
#[derive(Debug, PartialEq)]
enum MyError {
EscapeAtEndOfString,
InvalidEscapedChar(char),
}
struct InterpretEscapedString<'a> {
s: std::str::Chars<'a>,
}
impl<'a> Iterator for InterpretEscapedString<'a> {
type Item = Result<char, MyError>;
fn next(&mut self) -> Option<Self::Item> {
self.s.next().map(|c| match c {
'\\' => match self.s.next() {
None => Err(MyError::EscapeAtEndOfString),
Some('n') => Ok('\n'),
Some('\\') => Ok('\\'),
// etc.
Some(c) => Err(MyError::InvalidEscapedChar(c)),
},
c => Ok(c),
})
}
}
fn interpret_escaped_string(s: &str) -> Result<String, MyError> {
(InterpretEscapedString { s: s.chars() }).collect()
}
fn main() {
assert_eq!(interpret_escaped_string(r#""#), Ok("".into()));
assert_eq!(interpret_escaped_string(r#"a"#), Ok("a".into()));
assert_eq!(interpret_escaped_string(r#"\"#), Err(MyError::EscapeAtEndOfString));
assert_eq!(interpret_escaped_string(r#"\\"#), Ok("\\".into()));
assert_eq!(interpret_escaped_string(r#"a\n"#), Ok("a\n".into()));
assert_eq!(interpret_escaped_string(r#"a\."#), Err(MyError::InvalidEscapedChar('.')));
}
此类模块in the playground的更完整实现。