我有下面用PHP编写的代码,并且已经阅读了Cuda,以利用我原有的Geforce 8800 Ultra的GPU处理能力。如何将此嵌套组合测试转换为Cuda并行处理代码(如果可能的话......)? 2d阵列的总组合:$ a,$ b,$ c,$ d,$ e迅速上升到数万亿......
foreach($a as $aVal){
foreach($b as $bVal){
foreach($c as $cVal){
foreach($d as $dVal){
foreach($e as $eVal){
$addSum = $aVal[0]+$bVal[0]+$cVal[0]+$dVal[0]+$eVal[0];
$capSum = $aVal[1]+$bVal[1]+$cVal[1]+$dVal[1]+$eVal[1];
if($capSum <= CAP_LIMIT){
$tempArr = array("a" => $aVal[2],"b" => $aVal[2],"c" => $aVal[2],
"d" => $aVal[2],"e" => $aVal[2],"addTotal" => $addSum,"capTotal" => $capSum);
array_push($topCombinations, $tempArr);
if(count($topCombinations) > 1000){
$topCombinations = $ca->arraySortedDescend($topCombinations);
array_splice($topCombinations, 900);
}
}
}
}
}
}
}
答案 0 :(得分:1)
这是一个非常开放的问题。它需要在语言之间进行转换以及设计并行算法。我不会详细介绍,但简而言之:
如何并行化取决于数组的大小($ a - $ e)。如果它们足够大,则可以仅在网格中的线程中并行化外部的一个或两个循环,并按顺序执行内部循环。如果它们不是超大的,你可能想要展平2-3个外环或者可能使用CUDA中的2D或3D线程块和网格来实现它们。