最近我一直在研究(更多在实践中说实话)正则表达式,我注意到他的力量。我(link)提出这个要求,我知道'反向引用'。我想我理解它是如何工作的,它适用于JavaScript,而不是PHP。
例如我有这个字符串:
[b]Text B[/b]
[i]Text I[/i]
[u]Text U[/u]
[s]Text S[/s]
并使用以下正则表达式:
\[(b|i|u|s)\]\s*(.*?)\s*\[\/\1\]
在regex101.com上进行此测试的工作方式与JavaScript相同,但不适用于PHP。
preg_replace
(不工作)的示例:
echo preg_replace(
"/\[(b|i|u|s)\]\s*(.*?)\s*\[\/\1\]/i",
"<$1>$2</$1>",
"[b]Text[/b]"
);
虽然这种方式有效:
echo preg_replace(
"/\[(b|i|u|s)\]\s*(.*?)\s*\[\/(b|i|u|s)\]/i",
"<$1>$2</$1>",
"[b]Text[/b]"
);
我无法理解我错在哪里,感谢所有帮助我的人。
答案 0 :(得分:13)
这是因为你使用双引号字符串,在双引号字符串\1
内读取字符的八进制表示法(控制字符SOH =标题的开头),而不是转义为1. / p>
有两种方式:
使用单引号字符串:
'/\[(b|i|u|s)\]\s*(.*?)\s*\[\/\1\]/i'
或转义反斜杠以获取文字反斜杠(对于字符串,而不是模式):
"/\[(b|i|u|s)\]\s*(.*?)\s*\[\/\\1\]/i"
顺便说一句,你可以像这样编写你的模式:
$pattern = '~\[([bius])]\s*(.*?)\s*\[/\1]~i';
// with oniguruma notation
$pattern = '~\[([bius])]\s*(.*?)\s*\[/\g{1}]~i';
// oniguruma too but relative:
// (the second group on the left from the current position)
$pattern = '~\[([bius])]\s*(.*?)\s*\[/\g{-2}]~i';