NUMA意识到Cpp容器

时间:2016-05-03 14:16:53

标签: c++ performance memory-management parallel-processing numa

是否有一种方便有效的方式以NUMA识别的方式使用cpp标准容器API?

我想在cpp环境中进行OpenMP并行稀疏矩阵向量乘法。 要分配和初始化关于NUMA域的向量和矩阵值,C代码将以某种方式看起来像这样:

size_t N = 1000000;
double* vecVal = malloc (N*sizeof(double));

#pragma OMP parallel for
for (size_i=0; i<N; ++i)
{
    vecVal[i] = 0.;
}
/* do spMV */
delete vecVal;

在Cpp中我想使用std :: vector(具有固定大小的std :: array也可以)。 std :: vector :: reserve()可以做到吗? 做这样的事情是合法的:

std::vector<double> vec;
vec.reserve(N);
double *vecVal = vec.data();

#pragma OMP parallel for
for (size_i=0; i<N; ++i)
{
    vecVal[i] = 0.;
}
/* do spMV */

我怎样才能将正确的大小设置为std :: vector?

有谁知道更优雅的方式?

1 个答案:

答案 0 :(得分:3)

您必须在此处使用特殊的numa感知分配器。我们在这里为HPX实现了类似的功能:https://github.com/STEllAR-GROUP/hpx/blob/master/hpx/parallel/util/numa_allocator.hpp

基本思想是在分配器分配功能内部进行第一次触摸。用你的#omp parallel for schedule(static)循环替换HPX执行程序的东西,你应该没问题。