URL安全字符RegEx,允许UTF-8重音!

时间:2011-06-18 18:11:27

标签: regex url coldfusion url-rewriting

我正在寻找一个在rereplace()函数中使用的RegEx模式,该函数将保留URL安全字符,但包含带重音的UTF-8字符。例如:çã

类似于:url = rereplace(local.url, "pattern")等。我更喜欢ColdFusion解决方案,但我也愿意使用Java,因为它很容易与CF集成。

我的网址格式如下:/posts/[postId]/[title-with-accents-like-ç-and-ã]

2 个答案:

答案 0 :(得分:1)

我不知道你使用的语言是什么。 Perl有一些utf8匹配,例如参见Tatsuhiko Miyagawa的URI::Find::UTF8

答案 1 :(得分:0)

这可以通过使用\w匹配字母数字字符来完成。

rereplace(string, "[^\w]", "", "all")

请参阅this answer以供参考。