使用Cuda测试多个阵列的组合

时间:2012-02-03 07:21:16

标签: php cuda parallel-processing combinations pycuda

我有下面用PHP编写的代码,并且已经阅读了Cuda,以利用我原有的Geforce 8800 Ultra的GPU处理能力。如何将此嵌套组合测试转换为Cuda并行处理代码(如果可能的话......)? 2d阵列的总组合:$ a,$ b,$ c,$ d,$ e迅速上升到数万亿......

foreach($a as $aVal){
    foreach($b as $bVal){
        foreach($c as $cVal){
            foreach($d as $dVal){
                foreach($e as $eVal){

                    $addSum = $aVal[0]+$bVal[0]+$cVal[0]+$dVal[0]+$eVal[0];
                    $capSum = $aVal[1]+$bVal[1]+$cVal[1]+$dVal[1]+$eVal[1];
                    if($capSum <= CAP_LIMIT){
                        $tempArr = array("a" => $aVal[2],"b" => $aVal[2],"c" => $aVal[2],
                        "d" => $aVal[2],"e" => $aVal[2],"addTotal" => $addSum,"capTotal" => $capSum);

                        array_push($topCombinations, $tempArr);

                        if(count($topCombinations) > 1000){
                           $topCombinations = $ca->arraySortedDescend($topCombinations);
                           array_splice($topCombinations, 900);

                        }
                    }  
                }
            }
        }
    }
}

1 个答案:

答案 0 :(得分:1)

这是一个非常开放的问题。它需要在语言之间进行转换以及设计并行算法。我不会详细介绍,但简而言之:

如何并行化取决于数组的大小($ a - $ e)。如果它们足够大,则可以仅在网格中的线程中并行化外部的一个或两个循环,并按顺序执行内部循环。如果它们不是超大的,你可能想要展平2-3个外环或者可能使用CUDA中的2D或3D线程块和网格来实现它们。