如何使用IDN正则表达式匹配日语字符?

时间:2010-07-16 13:24:43

标签: javascript regex idn

根据这篇文章link text

我想出了一个javascript的正则表达式

\b(([\w-]+:\/\/?|[\w\d]+[.])?[^\s()<>]+[.](?:\([\w\d]+\)|([^`!()\[\]{};:'".,<>?«»“”‘’\s]|\/)))

这个匹配像

这样的网址
  • http://google.com
  • http://www.google.com
  • google.com

google失败了,但是当我使用像功功.jp这样的日文字符时,它失败了。

  • www.功功.jp
  • http://www.功功.jp
  • http://功功.jp

这些匹配。我应该更改什么,以便功功.jp也匹配。

1 个答案:

答案 0 :(得分:3)

这里做了非常轻微的修改,它对我有用:

/(([\w-]+:\/\/?|[\w\d]+[.])?[^\s()<>]+[.](?:\([\w\d]+\)|([^`!()\[\]{};:'\".,<>?«»“”‘’\s]|\/)+))/