用拉丁语对应替换外来字符,用连字符替换空格(PHP)

时间:2012-11-01 15:06:26

标签: php regex preg-replace str-replace

我有这段代码:

$header = 'weird character->>>ÅÅÖÄ';
$header = strtolower(str_replace(array('  ', ' '), '-', preg_replace('/[^a-zA-Z0-9 s]/', '', trim($header))));

它应该输出weird-characteraaoa,但它不会。它只是删除了ÅÅÖÄ字母。知道为什么这不起作用吗?我正在使用UTF-8,如果它与它有关

2 个答案:

答案 0 :(得分:2)

这是一个难题,因为并非所有语言都可以与ASCII字符很好地匹配。

然而,@ AlixAxel拥有我在其phunction framework中见过的最佳实现。

    public static function Slug($string, $slug = '-', $extra = null)
    {
        return strtolower(trim(preg_replace('~[^0-9a-z' . preg_quote($extra, '~') . ']+~i', $slug, self::Unaccent($string)), $slug));
    }

    public static function Unaccent($string)
    {
        if (extension_loaded('intl') === true)
        {
            $string = Normalizer::normalize($string, Normalizer::FORM_KD);
        }

        if (strpos($string = htmlentities($string, ENT_QUOTES, 'UTF-8'), '&') !== false)
        {
            $string = html_entity_decode(preg_replace('~&([a-z]{1,2})(?:acute|caron|cedil|circ|grave|lig|orn|ring|slash|tilde|uml);~i', '$1', $string), ENT_QUOTES, 'UTF-8');
        }

        return $string;
    }

答案 1 :(得分:2)

我想你可能想要创建一个自定义函数,如下所示:

function normalize ($string) {
   $table = array('Å'=>'A', 'Ä'=>'A','Ö'=>'O');
   return strtr($string, $table);
}

请添加您要使用的字符。