我试图运行这个正则表达式,但它卡住了我的控制台。为什么呢?
var str = "Шедевры православной музыки - 20 золотых православных песен";
str.match(/^(([\u00C0-\u1FFF\u2C00-\uD7FF]+[^a-z\u00C0-\u1FFF\u2C00-\uD7FF]*)+) [a-z]+[^\u00C0-\u1FFF\u2C00-\uD7FF]*$/i);
答案 0 :(得分:8)
由于(([\u00C0-\u1FFF\u2C00-\uD7FF]+[^a-z\u00C0-\u1FFF\u2C00-\uD7FF]*)+)
部分,您的正则表达式导致catastrophic backtracking(请参阅a demo of your regex here)。由于[^a-z\u00C0-\u1FFF\u2C00-\uD7FF]*
可以匹配零个字符,因此您基本上有一个类似于(a+)+
的经典模式(cf:([\u00C0-\u1FFF\u2C00-\uD7FF]+)+
)会导致回溯问题。
要摆脱它,您需要确保子模式在分组中是必修,并将*
量词应用于整个分组:
^([\u00C0-\u1FFF\u2C00-\uD7FF]+(?:[^a-z\u00C0-\u1FFF\u2C00-\uD7FF]+[\u00C0-\u1FFF\u2C00-\uD7FF]+)*) [a-z]+[^\u00C0-\u1FFF\u2C00-\uD7FF]*$
请参阅regex demo
此处[\u00C0-\u1FFF\u2C00-\uD7FF]+(?:[^a-z\u00C0-\u1FFF\u2C00-\uD7FF]+[\u00C0-\u1FFF\u2C00-\uD7FF]+)*
匹配:
[\u00C0-\u1FFF\u2C00-\uD7FF]+
- [\u00C0-\u1FFF\u2C00-\uD7FF]
范围内的一个或多个字符(?:[^a-z\u00C0-\u1FFF\u2C00-\uD7FF]+[\u00C0-\u1FFF\u2C00-\uD7FF]+)*
- 零个或多个序列:
[^a-z\u00C0-\u1FFF\u2C00-\uD7FF]+
- 除a-z\u00C0-\u1FFF\u2C00-\uD7FF
范围[\u00C0-\u1FFF\u2C00-\uD7FF]+
- \u00C0-\u1FFF\u2C00-\uD7FF
范围内的一个或多个字符。