需要帮助优化php字符串差异功能

时间:2009-06-05 17:40:20

标签: php string

我创建了这个函数,它适用于小字符串,但是对于更长的字符串,它会超时。我正在寻找一种方法来使功能更快,而不是超时,或者更好的方式来实现我想要的。

function find_diffs($string1, $string2)
{
    $array1 = preg_split("/\b/", $string1);
    $array2 = preg_split("/\b/", $string2);
    $array3 = array();


    for($i=0, $j=0; $i < count($array1) || $j < count($array2); $i++, $j++)
    {
        while(badchars($array1, $i))
        {
            $i++;
        }
        while(badchars($array2, $j))
        {
            $j++;
        }

        if($array1[$i] != $array2[$j])
        {
            //-------------------------Find Subtractions--------------------//
            $k = $i;
            while($array1[$i] != $array2[$j])
            {
                $i++;
                if($i == count($array1))
                {
                    $end = true;
                    break;
                }
                while(badchars($array1, $i))
                {
                    $i++;
                }
            }
            if($end)
            {
                //-------------------------Find Additions--------------------//
                $end = false;
                $i = $k;
                $k = $j;
                while($array1[$i] != $array2[$j])
                {
                    $j++;
                    if($j == count($array2))
                    {
                        $end = true;
                        break;
                    }
                    while(badchars($array2, $j))
                    {
                        $j++;
                    }
                }
                if($end)
                {
                    //-------------------------Find Changes--------------------//
                    $end = false;
                    $j = $k;
                    $l = $i;
                    while($array1[$i] != $array2[$j])
                    {

                        $k = $j;
                        while($array1[$i] != $array2[$j])
                        {
                            $j++;
                            if($j == count($array2))
                            {
                                $end = true;
                                break;
                            }
                            while(badchars($array2, $j))
                            {
                                $j++;
                            }
                        }

                        if($end)
                        {
                            $j = $k;
                            $i++;
                            while(badchars($array1, $i))
                            {
                                $i++;
                            }
                            while(badchars($array2, $j))
                            {
                                $j++;
                            }
                        }
                        else
                        {
                            $array3[] = array($l,$i,'-');
                            $array3[] = array($k,$j,'+');
                        }
                        if($i == count($array1))
                        {
                            $end = true;
                            break;
                        }
                        if($j == count($array2))
                        {
                            $end = true;
                            break;
                        }
                        $end=false;
                    }
                    if($end)
                    {
                            break;          
                    }
                    else
                    {
                        $array3[] = array($l,$i,'-');
                        $array3[] = array($k,$j,'+');
                    }   
                    //---------------------End Find Changes--------------------//
                }
                else
                {
                    $array3[] = array($k,$j,'+');
                }
            }
            else
            {
                $array3[] = array($k,$i,'-');
            }

        }
    }

    $array3[] = array(0,count($array1),'=');
    return array($array1,$array2,$array3);
}

1 个答案:

答案 0 :(得分:5)

不要重新发明轮子。这是容易出错并且很难做到的事情。

查看Text_Diff梨包。我已经将它用于此类事情并且做得非常好。