我实现了以下代码,使用“dat”中的数据点来计算每个点与所有其他点“dist”之间的距离矩阵。然后我使用这个距离矩阵找到数据“最小”中每个点的K个最近点,然后用它来找到K个最近邻居的总和。
以下算法是使用OpenMP的并行算法,它的工作非常精细。我只需要建议让它运行得更快。任何建议都受到高度赞赏。
vector<vector<double> > dist(dat.size(), vector<double>(dat.size()));
size_t p,j;
ptrdiff_t i;
double* sumKnn = new double[dat.size()];
vector<vector<int > > smallest(dat.size(), vector<int>(k));
#pragma omp parallel for private(p,j,i) default(shared)
for(p=0;p<dat.size();++p)
{
int mycont=0;
for (j = 0; j < dat.size(); ++j)
{
double ecl = 0.0;
for (i = 0; i < c; ++i)
{
ecl += (dat[p][i] - dat[j][i]) * (dat[p][i] - dat[j][i]);
}
ecl = sqrt(ecl);
dist[p][j] = ecl;
//dist[j][p] = ecl;
int index=0;
if(mycont<k && j!=p)
{
smallest[p][mycont]=j;
mycont++;
}
else if(j!=p)
{
double max=0.0;
int index=0;
for(int i=0;i<smallest[p].size();i++)
{
if(max < dist[p][smallest[p][i]])
{
index=i;
max=dist[p][smallest[p][i]];
}
}
if(max>dist[p][j])
{
smallest[p].erase(smallest[p].begin()+index);
smallest[p].push_back(j);
}
}
}
double sum=0.0;
for(int r=0;r<k;r++)
sum+= dist[p][smallest[p][r]];
sumKnn[p]=sum;
}
答案 0 :(得分:3)
这更多是评论而不是答案,但评论框太小,......
OpenMP的一个有用方面是您可以逐步并行化串行程序。因此,您的第一步应该是编写一个解决您问题的序列代码。当你完成后,你可以再次发布并寻求并行化的帮助。
要并行化您的程序,找到最外层的循环语句,并考虑如何跨线程分布循环迭代将影响计算。我怀疑你会想要创建一个关闭点的共享向量,因为循环会循环,然后只在一个线程的末尾对它进行排序。或者也许不是。