为什么这个正则表达式会让Chrome挂起?

时间:2013-06-14 20:21:27

标签: javascript regex google-chrome

尝试在Chrome的JS控制台中输入此内容。我发现这是一个正则表达式,用于检查某些内容是否为有效的URL:

"http://www.kvraudio.com/".match(/^(https?:\/\/)?([\da-z\.-]+)\.([a-z\.]{2,6})([\/\w \.-]*)*\/?$/);

返回匹配,因为它应该是。现在试试这个:

"tp:/www.kvraudio.com/forum/viewtopic.php".match(/^(https?:\/\/)?([\da-z\.-]+)\.([a-z\.]{2,6})([\/\w \.-]*)*\/?$/);

返回Null,因为它不匹配。现在.....试试这个:

"http://www.kvraudio.com/forum/viewtopic.php?p=5238905".match(/^(https?:\/\/)?([\da-z\.-]+)\.([a-z\.]{2,6})([\/\w \.-]*)*\/?$/);

什么也没有! JS似乎已经死了或以某种方式陷入循环。如果我在实际网页中使用上述内容,则会停止响应。甚至不会滚动!有人对此有任何解释吗?我做错了什么?!

1 个答案:

答案 0 :(得分:14)

因为您有catastrophic backtracking

([\/\w \.-]*)*

应修改此表达式以删除其中一颗星(*):

([\/\w \.-]*)

请注意,当无法进行比赛时,灾难性的回溯通常只会让人头疼。这就是你给出的第一个例子没有任何问题的原因。

您的第二个示例在点击([...]*)*之前退出,因此回溯无法生效。

有关灾难性回溯的更全面解释,请参阅我对这个问题的回答:
How can I recognize an evil regex?