我有一个像这样的数组
array
0 => string 'Schmitt' (length=6)
1 => string 'Maier' (length=1)
2 => string 'Müller' (length=7)
3 => string 'müller' (length=7)
4 => string 'mueller' (length=7)
5 => string 'Toll' (length=4)
我希望得到类似的东西
array
0 => string 'Schmitt' (length=6)
1 => string 'Maier' (length=1)
2 => string 'Müller' (length=7)
3 => string 'Toll' (length=4)
我想检查所有的变形虫,例如'ä'''''ü',它应该不区分大小写。
第一封信将是大写的,但我会自己解决。只需要帮助语音的东西,因为我不想做一个巨大的if...else
事。
答案 0 :(得分:1)
您可以尝试这样的事情:
$replacements = ['ü' => ['ue']];
$names = ['Schmitt', 'Maier', 'Müller', 'müller', 'mueller', 'Toll'];
$names = array_map('strtolower', $names);
$names = array_reduce($names, function ($carry, $name) use ($replacements) {
foreach ($replacements as $replaceWith => $replaceWhat) {
$name = str_replace($replaceWhat, $replaceWith, $name);
}
if (!in_array($name, $carry)) {
$carry[] = $name;
}
return $carry;
}, []);
$names = array_map('ucfirst', $names);
var_dump($names);
结果将是:
array(4) {
[0]=>
string(7) "Schmitt"
[1]=>
string(5) "Maier"
[2]=>
string(7) "Müller"
[3]=>
string(4) "Toll"
}
答案 1 :(得分:1)
你可以存储"语音版本"作为结果数组中的一个键(通过这种方式,您可以知道该单词是否已经添加而未使用in_array
进行搜索,您只需要检查该键是否存在):
$names = ['Schmitt', 'Maier', 'Müller', 'müller', 'mueller', 'Toll'];
$rules = ['ü' => 'ue', 'ä' => 'ae', 'ö' => 'oe', 'ß' => 'ss' ]; // uzw
$result = [];
foreach ($names as $name) {
$phonetic = strtr(mb_strtolower($name), $rules);
if ( !isset($result[$phonetic]) )
$result[$phonetic] = $name; // put mb_ucfirst here
}
$result = array_values($result);
print_r($result);
由于您正在处理多字节字符,因此需要使用mb_strtolower
来避免错误。出于同样的原因,如果你需要将第一个字符设为大写字母,你应该在php manual中使用plemieux发布的函数:
function mb_ucfirst($str) {
$fc = mb_strtoupper(mb_substr($str, 0, 1));
return $fc . mb_substr($str, 1);
}