测试PHP正则表达式引擎,我发现它只将[0-9A-Za-z_]
视为单词字符。非ASCII语言(如希伯来语)的字母不与[\w]
的字符匹配。是否有任何PHP或Perl正则表达式转义序列符合任何语言的字母?我可以为我希望使用的每个字母添加范围,但是用户总是会用意想不到的语言给我们带来惊喜!
请注意,这不是用于安全过滤,而是用于标记文本。
答案 0 :(得分:12)
尝试[\pL_]
- 请参阅
答案 1 :(得分:1)
试试\p{L}
。它匹配来自任何语言的任何类型的字母。如果您不想使用字符集[]
。