cl-ppcre:替换正则表达式替换和反斜杠

时间:2014-08-25 13:45:59

标签: regex lisp common-lisp cl-ppcre

可能这个问题真的很糟糕,但我被困住了。如何在cl-ppcre:regex-replace-all替换中添加反斜杠?

例如,我只想逃避一些像“' " ()等,所以我要做|先替换,看看匹配是否合适:

    CL-USER> (princ (cl-ppcre:regex-replace-all "(['\\(\\)\"])"
"foo \"bar\" 'baz' (test)" "|\\1"))
    PRINTED: foo |"bar|" |'baz|' |(test|)

好的,让我们放斜线:

    CL-USER> (princ (cl-ppcre:regex-replace-all "(['\\(\\)\"])"
"foo \"bar\" 'baz' (test)" "\\\1"))
    PRINTED: foo "bar" 'baz' (test) ;; No luck

不,我们有两个斜线:

    CL-USER> (princ (cl-ppcre:regex-replace-all "(['\\(\\)\"])"
"foo \"bar\" 'baz' (test)" "\\\\1"))
    PRINTED: foo \1bar\1 \1baz\1 \1test\1 ;; Got slash, but not \1

也许是这样的?

(princ (cl-ppcre:regex-replace-all "(['\\(\\)\"])"
"foo \"bar\" 'baz' (test)" "\\\{1}"))
PRINTED: foo "bar" 'baz' (test) ;; Nope, no luck here

当然,如果我在斜线之间放置空间就可以了,但我不需要它

(princ (cl-ppcre:regex-replace-all "(['\\(\\)\"])"
"foo \"bar\" 'baz' (test)" "\\ \\1"))
PRINTED: foo \ "bar\ " \ 'baz\ ' \ (test\ )

那么,我怎么写来打印foo \"bar\" \'baz\' \(test\)?谢谢。

2 个答案:

答案 0 :(得分:5)

六个源斜杠

CL-USER> (princ (cl-ppcre:regex-replace-all "(['\\(\\)\"])"
                                            "foo \"bar\" 'baz' (test)"
                                            "\\\\\\1"))
foo \"bar\" \'baz\' \(test\)

在源代码中编写字符串时,每个斜杠都被用作转义符。您希望替换文本是字符序列\\1。要对替换中的第一个斜杠进行编码(因为CL-PPCRE将处理斜杠),CL-PPCRE需要查看字符序列\\\1。前两个斜杠编码斜杠,第三个斜杠编码组编号。要将该字符序列作为Lisp字符串,您必须编写"\\\\\\1"

答案 1 :(得分:0)

迟到的答案,但对于其他人,请注意在这种情况下你最好避免使用字符串:

(cl-ppcre:regex-replace-all '(:register (:char-class #\' #\( #\) #\"))
                            "foo \"bar\" 'baz' (test)"
                            '("\\" 0))