标签: php regex utf-8 pcre non-ascii-characters
为什么字母é在下面的示例中计为与\b匹配的字边界?
é
\b
模式:/\b(cum)\b/i
/\b(cum)\b/i
文字:écumé
écumé
匹配'暨',这是不可取的。
有可能克服这个问题吗?
答案 0 :(得分:4)
当您将u修饰符添加到正则表达式
u
/\b(cum)\b/iu
答案 1 :(得分:0)
要处理unicode,请将\b替换为
/(?<=^|\PL)(cum)(?=\PL|$)/i