正则表达式 - PCRE(PHP) - 字边界(\ b)和重音字符

时间:2014-02-27 12:35:48

标签: php regex utf-8 pcre non-ascii-characters

为什么字母é在下面的示例中计为与\b匹配的字边界?

模式:/\b(cum)\b/i

文字:écumé

匹配'暨',这是不可取的。

有可能克服这个问题吗?

2 个答案:

答案 0 :(得分:4)

当您将u修饰符添加到正则表达式

时,它会起作用
/\b(cum)\b/iu

答案 1 :(得分:0)

要处理unicode,请将\b替换为

/(?<=^|\PL)(cum)(?=\PL|$)/i