Regexp不评估元字符\ w

时间:2016-02-14 15:28:18

标签: regex racket

在Racket中摆弄我正在尝试编写一个使用正则表达式来处理模式的简单词法分析器,但它似乎不想使用元字符\w

#lang racket

(define (tokenize-broken str)
  (match str
    ["\"" 'StringDelim]
    [(regexp #rx"#\\w+") 'Message]
    [_ 'Undefined]))

(define (tokenize-working str)
  (match str
    ["\"" 'StringDelim]
    [(regexp #rx"#[a-zA-Z_]+") 'Message]
    [_ 'Undefined]))

现在,当我尝试在repl中运行它时,我得到了这个:

> (tokenize-broken "#msg")
'Undefined
> (tokenize-working "#msg")
'Message

那么这里发生了什么?为什么我不能让\w工作?它在支持正则表达式的其他语言中工作正常,为什么不在这里?

1 个答案:

答案 0 :(得分:2)

我认为\w中未包含regexp。试试pregexp(即“Perl”regexp),然后使用#px代替#rx

(define (tokenize-fixed str)
  (match str
    ["\"" 'StringDelim]
    [(pregexp #px"#\\w+") 'Message]
    [_ 'Undefined]))

> (tokenize-fixed "#msg")
'Message

有效:http://pasterack.org/pastes/19596