基本上,如果两个字符串在我的数据库中评估为相同,我也希望能够在应用程序级别检查它。例如,如果有人在搜索字段中输入“bjork”,我希望PHP能够将其与字符串“Björk”匹配,就像MySQL一样。
我猜测PHP没有直接等同于MySQL的排序规则选项,而最简单的做法是编写一个简单的函数来转换字符串,使用strtolower()使它们统一为小写和strstr( )用相应的ASCII等价物替换多字节字符。
这是一个准确的假设吗?有没有人可以使用傻瓜式数组作为strstr()的第二个参数,用于符合各种MySQL排序规则的字符串(特别是针对我目前的需求,utf8_general_ci)?或者,缺少这一点,我在哪里可以找到MySQL中不同排序规则如何处理各种字符的文档? (例如,我在某些地方看到,在一些校对中,ß被视为S而在其他情况下被视为Ss,但它没有概述每一个角色评估。)
答案 0 :(得分:3)
这是我一直在使用的内容,但我还没有测试它与MySQL完全一致。
function collation_conform($string,$collation='utf8_general_ci')
{
if($collation === 'utf8_general_ci')
{
if(!is_string($string))
return $string;
$string = strtr($string, array(
'Š'=>'S', 'š'=>'s', 'Ð'=>'D', 'Ž'=>'Z', 'ž'=>'z', 'À'=>'A', 'Á'=>'A', 'Â'=>'A', 'Ã'=>'A', 'Ä'=>'A',
'Å'=>'A', 'Æ'=>'A', 'Ç'=>'C', 'È'=>'E', 'É'=>'E', 'Ê'=>'E', 'Ë'=>'E', 'Ì'=>'I', 'Í'=>'I', 'Î'=>'I',
'Ï'=>'I', 'Ñ'=>'N', 'Ò'=>'O', 'Ó'=>'O', 'Ô'=>'O', 'Õ'=>'O', 'Ö'=>'O', 'Ø'=>'O', 'Ù'=>'U', 'Ú'=>'U',
'Û'=>'U', 'Ü'=>'U', 'Ý'=>'Y', 'Þ'=>'B', 'ß'=>'Ss','à'=>'a', 'á'=>'a', 'â'=>'a', 'ã'=>'a', 'ä'=>'a',
'å'=>'a', 'æ'=>'a', 'ç'=>'c', 'è'=>'e', 'é'=>'e', 'ê'=>'e', 'ë'=>'e', 'ì'=>'i', 'í'=>'i', 'î'=>'i',
'ï'=>'i', 'ð'=>'o', 'ñ'=>'n', 'ò'=>'o', 'ó'=>'o', 'ô'=>'o', 'õ'=>'o', 'ö'=>'o', 'ø'=>'o', 'ù'=>'u',
'ú'=>'u', 'û'=>'u', 'ý'=>'y', 'ý'=>'y', 'þ'=>'b', 'ÿ'=>'y', 'ƒ'=>'f'));
return strtolower($string);
}
else die('Unsupported Collation (collation_conform() collation_helper.php)');
}
答案 1 :(得分:0)
你看过PHP校对课吗? http://www.php.net/manual/en/class.collator.php
答案 2 :(得分:-1)
请尝试以下代码。
$s1 = 'Björk';
$s2 = 'bjork';
var_dump(
is_same_string($s1, $s2)
);
function is_same_string($str, $str2, $locale = 'en_US')
{
$coll = collator_create($locale);
collator_set_strength($coll, Collator::PRIMARY);
return 0 === collator_compare($coll, $str, $str2);
}