并行算法找到K个最近点

时间:2012-03-05 12:18:34

标签: c++ visual-c++ openmp parallel-processing

我实现了以下代码,使用“dat”中的数据点来计算每个点与所有其他点“dist”之间的距离矩阵。然后我使用这个距离矩阵找到数据“最小”中每个点的K个最近点,然后用它来找到K个最近邻居的总和。

以下算法是使用OpenMP的并行算法,它的工作非常精细。我只需要建议让它运行得更快。任何建议都受到高度赞赏。

vector<vector<double> > dist(dat.size(), vector<double>(dat.size()));
size_t p,j;
ptrdiff_t i;
double* sumKnn = new double[dat.size()];
vector<vector<int > > smallest(dat.size(), vector<int>(k));
#pragma omp parallel for private(p,j,i) default(shared)
for(p=0;p<dat.size();++p)
{
    int mycont=0;
    for (j = 0; j < dat.size(); ++j)
    {
        double ecl = 0.0;
        for (i = 0; i < c; ++i)
        {
            ecl += (dat[p][i] - dat[j][i]) * (dat[p][i] - dat[j][i]);
        }
        ecl = sqrt(ecl);
        dist[p][j] = ecl;
        //dist[j][p] = ecl;
        int index=0; 
        if(mycont<k && j!=p)
        {
            smallest[p][mycont]=j;
            mycont++;
        }
        else if(j!=p)
        {
            double max=0.0;
            int index=0;
            for(int i=0;i<smallest[p].size();i++)
            {
                if(max < dist[p][smallest[p][i]])
                {
                    index=i;
                    max=dist[p][smallest[p][i]];
                } 
            }
            if(max>dist[p][j])
            {
                smallest[p].erase(smallest[p].begin()+index);
                smallest[p].push_back(j);
            }
        }        
    }
    double sum=0.0;
    for(int r=0;r<k;r++)
        sum+= dist[p][smallest[p][r]];
    sumKnn[p]=sum; 
}  

1 个答案:

答案 0 :(得分:3)

这更多是评论而不是答案,但评论框太小,......

OpenMP的一个有用方面是您可以逐步并行化串行程序。因此,您的第一步应该是编写一个解决您问题的序列代码。当你完成后,你可以再次发布并寻求并行化的帮助。

要并行化您的程序,找到最外层的循环语句,并考虑如何跨线程分布循环迭代将影响计算。我怀疑你会想要创建一个关闭点的共享向量,因为循环会循环,然后只在一个线程的末尾对它进行排序。或者也许不是。