Php clean双击破坏str_replace

时间:2011-12-06 09:18:54

标签: php mysql

我正在使用php清除要在url slug中使用的名称:,其中$ title可能如下所示:“这是标题”或“这是标题和字幕”

以上示例我想分别改为“this-is-the-title”和“this-is-the-title-subtitle”。所以,我制作了这段代码......

<?php 
$input1 = str_replace(" ","-",strtolower($title)); 
$output1 = preg_replace('/[^A-Za-z0-9-]/', '', $input1); 
$output2 = str_replace("--","-",$output1); 
echo $output2; 
?>

它运行良好,清除所有非字母数字,用破折号替换空格并使所有内容都小写。

然而,在某些情况下,它会返回双击(“Title&amp; More”转到(“title - more”)。它应该是“title-more”。我知道为什么双击,但我似乎无法清理它。

我为$ output2添加了代码行,但由于某种原因它似乎没有用。经过大量的反复试验,我感到很茫然。

...谢谢

7 个答案:

答案 0 :(得分:5)

您可以在单个正则表达式中解决相同问题:

preg_replace('/[^a-z0-9]+/', '-', strtolower($title));

我所做的唯一改变是正则表达式中的尾随+,意思是“前一组中出现1次或更多次”。现在,每组特殊字符都被替换为一个短划线 - 无论该组有多长。

仅仅是为了回答实际问题:你需要在你的案例中减少循环中的重复破折号:

$output2 = $output1;
do {
    $output1 = $output2;
    $output2 = str_replace("--", "-", $output1);
} while ($output2 != $output1);

(我会认真考虑重命名变量)

答案 1 :(得分:3)

我正在使用自己编写的函数来达到完全相同的目标。

function urlify($string, $utf8Input = false) {
    $string = strtolower(iconv($utf8Input ? 'UTF-8' : 'ISO-8859-1', 'ASCII//TRANSLIT', $string));
    $string = preg_replace('/[^a-z0-9]+/', '-', $string);
    $string = trim($string, '-');
    if (empty($string)) return '-';
    return $string;
}

如果您不使用使用重音字母的语言,则可以删除UTF8和iconv部分。

答案 2 :(得分:2)

我可以分享我的小功能。甚至可以用于各种语言。俄语,德语等。

public static function getSeo($str, $separator = '-'){
    $from = array('А', 'Б', 'В', 'Г', 'Д', 'Е', 'Ё', 'Ж', 'З', 'И', 'Й', 'К', 'Л', 'М', 'Н', 'О', 'П', 'Р',
        'С', 'Т', 'У', 'Ф', 'Х', 'Ц', 'Ч', 'Ш', 'Щ', 'Ъ', 'Ы', 'Ь', 'Э', 'Ю', 'Я', 'а', 'б', 'в', 'г', 'д', 'е', 'ё',
        'ж', 'з', 'и', 'й', 'к', 'л', 'м', 'н', 'о', 'п', 'р', 'с', 'т', 'у', 'ф', 'х', 'ц', 'ч', 'ш', 'щ', 'ъ', 'ы',
        'ь', 'э', 'ю', 'я', "Á", "À", "Â", "Ä", "Ă", "Ā", "Ã", "Å", "Ą", "Æ", "Ć", "Ċ", "Ĉ", "Č", "Ç", "Ď", "Đ", "Ð",
        "É", "È", "Ė", "Ê", "Ë", "Ě", "Ē", "Ę", "Ə", "Ġ", "Ĝ", "Ğ", "Ģ", "á", "à", "â", "ä", "ă", "ā", "ã", "å", "ą",
        "æ", "ć", "ċ", "ĉ", "č", "ç", "ď", "đ", "ð", "é", "è", "ė", "ê", "ë", "ě", "ē", "ę", "ə", "ġ", "ĝ", "ğ", "ģ",
        "Ĥ", "Ħ", "I", "Í", "Ì", "İ", "Î", "Ï", "Ī", "Į", "IJ", "Ĵ", "Ķ", "Ļ", "Ł", "Ń", "Ň", "Ñ", "Ņ", "Ó", "Ò", "Ô",
        "Ö", "Õ", "Ő", "Ø", "Ơ", "Œ", "ĥ", "ħ", "ı", "í", "ì", "i", "î", "ï", "ī", "į", "ij", "ĵ", "ķ", "ļ", "ł", "ń",
        "ň", "ñ", "ņ", "ó", "ò", "ô", "ö", "õ", "ő", "ø", "ơ", "œ", "Ŕ", "Ř", "Ś", "Ŝ", "Š", "Ş", "Ť", "Ţ", "Þ", "Ú",
        "Ù", "Û", "Ü", "Ŭ", "Ū", "Ů", "Ų", "Ű", "Ư", "Ŵ", "Ý", "Ŷ", "Ÿ", "Ź", "Ż", "Ž", "ŕ", "ř", "ś", "ŝ", "š", "ş",
        "ß", "ť", "ţ", "þ", "ú", "ù", "û", "ü", "ŭ", "ū", "ů", "ų", "ű", "ư", "ŵ", "ý", "ŷ", "ÿ", "ź", "ż", "ž"
    );
    $to = array('A', 'B', 'V', 'G', 'D', 'E', 'E', 'Z', 'Z', 'I', 'J', 'K', 'L', 'M', 'N', 'O', 'P', 'R', 'S',
        'T', 'U', 'F', 'H', 'C', 'Tch', 'Sh', 'Shtch', '', 'Y', '', 'E', 'Iu', 'Ja', 'a', 'b', 'v', 'g', 'd', 'e',
        'e', 'z', 'z', 'i', 'j', 'k', 'l', 'm', 'n', 'o', 'p', 'r', 's', 't', 'u', 'f', 'h', 'c', 'tch', 'sh',
        'shtch', '', 'y', '', 'e', 'iu', 'ja', "A", "A", "A", "A", "A", "A", "A", "A", "A", "AE", "C", "C", "C", "C",
        "C", "D", "D", "D", "E", "E", "E", "E", "E", "E", "E", "E", "G", "G", "G", "G", "G", "a", "a", "a", "a", "a",
        "a", "a", "a", "a", "ae", "c", "c", "c", "c", "c", "d", "d", "d", "e", "e", "e", "e", "e", "e", "e", "e", "g",
        "g", "g", "g", "g", "H", "H", "I", "I", "I", "I", "I", "I", "I", "I", "IJ", "J", "K", "L", "L", "N", "N", "N",
        "N", "O", "O", "O", "O", "O", "O", "O", "O", "CE", "h", "h", "i", "i", "i", "i", "i", "i", "i", "i", "ij", "j",
        "k", "l", "l", "n", "n", "n", "n", "o", "o", "o", "o", "o", "o", "o", "o", "o", "R", "R", "S", "S", "S", "S",
        "T", "T", "T", "U", "U", "U", "U", "U", "U", "U", "U", "U", "U", "W", "Y", "Y", "Y", "Z", "Z", "Z", "r", "r",
        "s", "s", "s", "s", "B", "t", "t", "b", "u", "u", "u", "u", "u", "u", "u", "u", "u", "u", "w", "y", "y", "y",
        "z", "z", "z"
    );
    $str = str_replace($from, $to, $str);
    $str = iconv('UTF-8', 'ASCII//IGNORE//TRANSLIT', $str);
    $str = trim(preg_replace('/[^ A-Za-z0-9_-]/', ' ', $str));
    return preg_replace('/[ -]+/', $separator, $str);
}

答案 3 :(得分:0)

您可以使用一个<space>&<space>替换-。或使用单个-

替换-的多个实例

答案 4 :(得分:0)

使用此功能删除多个空格 - preg_replace('/\s+/', ' ', $title)
在此之后将破折号添加到字符串 - str_replace(" ","-",strtolower($title));

答案 5 :(得分:0)

在这个问题上睡觉之后,然后阅读这些回复(一如既往地感谢)它终于让我意识到发生了什么。

我的代码留下了三个破折号: 这:“书籍和杂志” 正在改变这个:“书籍---杂志”(以及用短划线和空格替换以及3个破折号)

我通过str_replace运行它以清除双破折号,但仍然留下了双破折号,这让我疯狂。

我一直这样说:“书籍 - 杂志”

原来str_replace实际上正在运行。由于有三个破折号,第一个双破折号被替换,现在是第三个破折号,但只剩下一个破折号。

因此,这个:“---”变成了这个“ - ”

我需要再次通过str_replace运行它来解决问题。求解问题看起来就像我的原始代码,但还有1行。

可能不是最优雅的解决方案,但它终于在我的脑海中起作用了。

<?php 
$input1 = str_replace(" ","-",strtolower($title)); 
$output1 = preg_replace('/[^A-Za-z0-9-]/', '', $input1); 
$output2 = str_replace("--","-",$output1); 
$output3 = str_replace("--","-",$output2); 
echo $output3; 
?>

答案 6 :(得分:0)

我认为这是最好的:

 $output =  trim(preg_replace('/-+/', '-', $str), '-');

更多:How can I convert two or more dashes to singles and remove all dashes at the beginning and end of a string?