我有以下代码。
$pattern = '~[a-z0-9]+~';
preg_match_all($pattern, "some text from a website", $array);
哪种方式适用于英语 - 或美国美国英语,但如何使其适用于所有其他语言?我从html中检测到了chaset和语言。
编辑:我想我必须使用http://php.net/manual/en/regexp.reference.unicode.php - http://www.regular-expressions.info/unicode.html
任何人都知道如何使用Unicode正则表达式匹配任何语言(a-z0-9)?
提前致谢。
答案 0 :(得分:0)
答案是使用代码正则表达式在任何语言中代表[a-z0-9]的模式是:
$pattern = '~[\p{L}\p{Nd}]+~';