从红色语言中删除字符串中的特殊字符

时间:2017-09-20 18:03:00

标签: regex rebol red

我想删除字符串中的所有字符,除了:

  • -_.
  • AZ
  • az
  • 09
  • 空间

在linux命令行上,使用sed我会这样做:

$ echo "testing-#$% yes.no" | sed 's/[^-_.a-zA-Z0-9 ]//g'

输出:

testing- yes.no

如何使用PARSE在Red语言中实现相同的效果?我看了看:

然而,我无法编纂它。我试过了:

>> parse "mystring%^&" [#a - #z #A - #Z #0 - #9]
== false
>> parse "mystring%^&" [#a-#z#A-#Z#0-#9]        
== false

3 个答案:

答案 0 :(得分:5)

首先注意ISSUE之间的区别!和CHAR!

#a #b #c  ; issues
#"a" #"b" #"c"   ; chars

然后,您可以为要保留的字符或要放弃的字符建立字符集(BITSET!类型)。我们在这里做前者:

good-chars: charset [#"a" - #"z" #"A" - #"Z" #"0" - #"9"]

现在我们有了这个,我们可以用不同的方式来解决这个问题:

解析

一个相当基本的解析循环 - 跳过任何good-chars并删除其他任何内容。

parse "mystring%^&" [any [some good-chars | remove skip]]

移除-每个

希望不言自明:

remove-each char "mystring%^&" [not find good-chars char]

答案 1 :(得分:3)

首先,字符必须是引号,#aissue!char!#"a"。您的规范是正确的,但您必须将其传递给charset函数,才能形成bitset!表单。

然后你可以parse你的字符串,keep有效字符和skip无效:

>> chars: charset [#"a" - #"z" #"A" - #"Z" #"0" - #"9"]
== make bitset! #{000000000000FFC07FFFFFE07FFFFFE0}
>> rejoin parse "mystring%^&asdf" [collect some [keep chars | skip]]
== "mystringasdf"

答案 2 :(得分:2)

PARSE的另一种解决方案是REPLACE使用COMPLEMENT CHARSET

replace/all "mystring%^&" complement charset [{-_. } #"a" - #"z" #"0" - #"9"] {}

NB。以上在Rebol(2& 3)中有效。不幸的是,它目前挂在Red(在MacOS上测试为0.63)。