从字符串中删除陌生人字母字符

时间:2016-10-06 10:14:00

标签: php regex preg-replace

我正在尝试从用户输入加载建议,但如果用户输入了一些stanger字母字符(中文,希腊语......),我的查询将失败。

$alphaAccent =    array('À', 'Á', 'Â', 'Ã', 'Ä', 'Å', 'Ç', 'È', 'É', 'Ê', 'Ë', 'Ì', 'Í', 'Î', 'Ï', 'Ò', 'Ó', 'Ô', 'Õ', 'Ö', 'Ù', 'Ú', 'Û', 'Ü', 'Ý', 'à', 'á', 'â', 'ã', 'ä', 'å', 'ç', 'è', 'é', 'ê', 'ë', 'ì', 'í', 'î', 'ï', 'ð', 'ò', 'ó', 'ô', 'õ', 'ö', 'ù', 'ú', 'û', 'ü', 'ű', 'ý', 'ÿ');
    $str = preg_replace('/[^A-Za-z0-9\-'.implode($alphaAccent).']/', '', $str); // Removes special chars.

看起来preg_replace没有检查此类字符,而是将 字符放在$str中。

对此有任何提示吗?

1 个答案:

答案 0 :(得分:1)

您需要将/u UNICODE modifier传递给正则表达式,以便它可以匹配

$alphaAccent = array('À', 'Á', 'Â', 'Ã', 'Ä', 'Å', 'Ç', 'È', 'É', 'Ê', 'Ë', 'Ì', 'Í', 'Î', 'Ï', 'Ò', 'Ó', 'Ô', 'Õ', 'Ö', 'Ù', 'Ú', 'Û', 'Ü', 'Ý', 'à', 'á', 'â', 'ã', 'ä', 'å', 'ç', 'è', 'é', 'ê', 'ë', 'ì', 'í', 'î', 'ï', 'ð', 'ò', 'ó', 'ô', 'õ', 'ö', 'ù', 'ú', 'û', 'ü', 'ű', 'ý', 'ÿ');
$str = preg_replace('/[^A-Za-z0-9\-'.implode($alphaAccent).']/u', '', $str);

简而言之,它使模式识别Unicode,并使PHP将字符串视为Unicode字符串。