我正在尝试为Insertion排序编写OpenMP解决方案,但是我遇到了让它并行运行并给出正确结果的问题:)。有没有办法让Insertion排序并行运行。
这是我的代码:
void insertionsort(int *A, int num)
{
// clock_t start, stop;
//
// start=clock();
int k;
#pragma omp parallel for shared(A) private(k)
for(int n = 1; n < num; n++)
{
int key = A[n];
k = n;
#pragma omp critical
for(;k>0 && A[k-1]> key;k--)
{
A[k] = A[k-1];
}
A[k] = key;
}
// stop=clock();
// cas = (double)(stop-start)/CLOCKS_PER_SEC;
}
答案 0 :(得分:7)
您不能以这种方式并行化插入排序算法。从内循环条件A[k-1]> key;
可以看出,该算法假设对于数组位置key
中的给定k
,如果实际密钥大于存储的密钥在数组的先前位置,swap
应该停止。因此,该算法假设k
下面的位置上的键已经排序。
当您引入并行化时,例如,两个线程,线程0将从数组的开头开始,线程1将从一半开始。根据算法的假设,问题是前半部分没有排序,因此会导致问题。
让我举个例子,用{2}个线程对array = [-1,2,-3,4,-5,6,-7,8]
进行排序:
让我们修复一个给定的执行顺序(实际上是非确定性的)
[-1,2,-3,4,-5,6,-7,8]
[-1,2,-3,4,-5,6,-7,8]
[-3,-1,2,4,-5,6,-7,8]
[-7,-3,-1,2,4,-5,6,8]
[-7,-3,-1,2,4,-5,6,8]
[-7,-3,-1,2,4,-5,6,8]
[-7,-3,-1,2,4,-5,6,8]
最终结果:[-7,-3,-1,2,4,-5,6,8]
在第4行第1个线程从位置-7
获取键6
并放置在数组的末尾,从位置1 to 6
(包括)中筛选所有元素到右边的一个位置,现在-5
位于-7
的旧位置。因为,-7(6)的旧位置永远不会被再次比较-5
将保持不可触及。因此,使算法无法排序。
一个简单但不好的解决方案是将OpenMP ordered
子句添加到parallel for
构造中。但是,使用它会使您的代码基本上是顺序代码。
另一个可能的解决方案,虽然我不是100%确定它可以适合你的情况,但是通过常规采样使你的算法并行。您可以看到here后一种技术的示例适用于quicksort
。
算法的结构不是直接并行化并实现加速的最佳结构。由于内循环的每次迭代都是相互依赖的,因此需要使用方法来确保互斥,从而导致开销。你有更好的排序算法可以直接并行化,通常是那些使用分而治之策略的算法,如Radix Sort或Quick Sort等。