PHP-REGEX:重音字母与非重音字母匹配,反之亦然。怎么做到这一点?

时间:2012-05-31 16:06:14

标签: php regex pattern-matching case-insensitive non-ascii-characters

我想做典型的高亮代码。所以我有类似的东西:

$valor = preg_replace("/(".$_REQUEST['txt_search'].")/iu", "<span style='background-color:yellow; font-weight:bold;'>\\1</span>", $valor);

现在,请求词可能类似于“josé”。有了它,我也希望“jose”或“JOSÉ”或“José”等突出显示。

使用这个表达式,如果我写“josé”,它匹配“josé”和“JOSÉ”(以及所有案例变体)。它始终只与重音变体匹配。如果我搜索“jose”,它会匹配“JOSE”,“jose”,“Jose”而不是重音符号。所以我部分地想要什么,因为我对重音和非重音分别不区分大小写。

我需要它完全结合,这意味着口音(unicode)不敏感,所以我可以搜索“jose”,并突出显示“josé”,“josÉ”,“José”,“JOSE”,“JOSÉ”,“JoSé” ,...

我不想替换单词上的重音,因为当我在屏幕上打印时,我需要看到真实的单词。

有什么想法吗?

谢谢!

2 个答案:

答案 0 :(得分:9)

您可以尝试创建一个函数来根据您的txt_search创建正则表达式,将所有可能的匹配替换为所有可能的匹配,如下所示:

function search_term($txt_search) {
    $search = preg_quote($txt_search);

    $search = preg_replace('/[aàáâãåäæ]/iu', '[aàáâãåäæ]', $search);
    $search = preg_replace('/[eèéêë]/iu', '[eèéêë]', $search);
    $search = preg_replace('/[iìíîï]/iu', '[iìíîï]', $search);
    $search = preg_replace('/[oòóôõöø]/iu', '[oòóôõöø]', $search);
    $search = preg_replace('/[uùúûü]/iu', '[uùúûü]', $search);
    // add any other character

    return $search;
}

然后在preg_replace上使用结果作为正则表达式。

答案 1 :(得分:1)

您可能必须解析搜索字符串,并修改正则表达式中的模式,以便包含[eéÉ]等案例。用全能[eEéÉ]替换所有e / E /é/É实例。对所有其他情况也这样做。因此,在您的示例中,搜索模式(而不是Jose /José/JOSÉ)将为jos[éÉeE]