preg_match_all和多种语言

时间:2013-01-21 01:26:56

标签: preg-match-all multilingual

我有以下代码。

$pattern = '~[a-z0-9]+~';
preg_match_all($pattern, "some text from a website", $array); 

哪种方式适用于英语 - 或美国美国英语,但如何使其适用于所有其他语言?我从html中检测到了chaset和语言。

编辑:我想我必须使用http://php.net/manual/en/regexp.reference.unicode.php - http://www.regular-expressions.info/unicode.html

任何人都知道如何使用Unicode正则表达式匹配任何语言(a-z0-9)?

提前致谢。

1 个答案:

答案 0 :(得分:0)

答案是使用代码正则表达式在任何语言中代表[a-z0-9]的模式是:

$pattern = '~[\p{L}\p{Nd}]+~';

这里非常有用的文章:http://www.regular-expressions.info/unicode.html