超过对差异挑战的执行时间限制

时间:2013-12-03 09:23:49

标签: php performance algorithm

我最近不得不做一个代码挑战,在那里我被指示对于一组数字,找到差异为K的对的数量。例如,给出数字1, 5, 3, 4, 2,和差值K(2) )有3对:(5,3)(4,2)(3,1)。我在PHP中尝试了这个挑战。我的代码通过了测试,但我觉得效率很低,因为有些测试超时了。谁能告诉我如何改进它?我正在抨击我,因为我无法弄清楚如何提高效率。

这是我的代码

<?php
    // Open STDIN for reading
    $stdin = fopen('php://stdin', 'r');

    // Get the input
    while(!feof($stdin)) {
        $inputs[] = explode(' ', fgets($stdin));
    }
    fclose($handle);

    $k = $inputs[0][1];
    $values = array_map('intval', array_values($inputs[1]));

    // Sort in decending order
    rsort($values);

    // Given the difference, K, find a pair for $left within
    // $right whose difference is K
    function findPair($k, $left, $right){
        foreach($right as $n) {
            if($left - $n == $k)
                return $n;
            // If the difference is greater than $k, there is no pair
            if($left - $n > $k)
                return false;
        }

        return false;
    }

    $pairs = 0;

    while(count($values) > 1){ 
        $left = array_shift($values);
        $n = findPair($k, $left, $values);

        if($n !== false)
            $pairs++;
    }

    echo $pairs;
?>

1 个答案:

答案 0 :(得分:3)

您的代码具有O(n^2)复杂度 - 因此在大型数据集上效率低下。它是O(n^2),因为您在函数内部使用foreach循环遍历所有数组,并在外部循环中在while中调用它。

但是您可以使用O(n x log(N))轻松完成这些操作:

function binSearch($array, $value, $from=null, $till=null)
{
   $from = isset($from)?$from:0;
   $till = isset($till)?$till:count($array)-1;
   if($till<$from)
   {
      return null;
   }
   $middle = (int)($from + ($till - $from)/2);
   if($array[$middle]>$value)
   {
      return binSearch($array, $value, $from, $middle-1);
   }
   if($array[$middle]<$value)
   {
      return binSearch($array, $value, $middle+1, $till);
   }
   return $middle;
}

$data = [1, 5, 3, 4, 2];
$k    = 2;

sort($data); //O(n x log(n))
$count = 0;

foreach($data as $value) //O(n)
{
   $count += null===binSearch($data, $value+$k)?0:1;//O(log(N))
}
var_dump($count);

- 所以,您将使用标准sort()O(n log(n))复杂度,然后使用二进制搜索N次。二进制搜索有O(log(n)) complexity,因此循环复杂度也是O(n log (n))。因此,整个代码的复杂性将为O(n log(n)) + O(n log(n)) = O(n log(n))

注意:标准PHP的in_array()O(N) complexity,因此使用它会产生O(N^2)循环的复杂性估算,因此,O(N^2)代码复杂性。

注意:通过sort()排序会产生quick sorting。此算法具有O(n log(n)) 平均复杂度,最糟糕的情况是O(N^2) - 因此可能存在数据集的情况,上面的代码也可能效率低下。您可以查看其他sorting algorithms。例如,如果您的问题是时间限制,您可以尝试merge sort - 它会非常快(但需要额外的空间)。

注意:如果我们谈论时间复杂度并且空间复杂性无关紧要,那么只需使用简单的哈希映射即可。在PHP中,它只是数组:

$array = [1, 5, 3, 4, 2];
$k = 2;

$count = 0;
$map   = [];

foreach ($array as $number) //O(n) time
{
   $map[$number] = $number;
}
foreach($map as $key=>$nevermind) //O(n) time
{
   //O(1) if there are no duplicates, very close to O(1) otherwise
   $count += array_key_exists($key+$k, $map); 
}

var_dump($count);

- 这会导致O(n)时间复杂度和O(2n)=O(n)空间复杂度。