标签: php regex utf-8 pcre
我知道在正常php regex(ASCII模式)中,“\ w”(字)表示“字母,数字和_”。但是,当您使用带有the "u" modifier的多字节正则表达式时,它意味着什么?
preg_replace('/\W/u', '', $string);
答案 0 :(得分:6)
任何不是字母,数字或下划线的东西。
因此,就Unicode字符类而言,\W等同于不在L或N字符类中且不是下划线字符的每个字符。
\W
如果您使用\p{xx}语法编写它,则相当于[^\p{LN}_]。
\p{xx}
[^\p{LN}_]