如何获取cudaMallocPitch分配的总内存(以字节为单位)?我需要通过库(Nvidia的NCCL)将这些数据发送到另一个gpu,它需要一个基本指针和字节数。我知道用于复制的cudaMemcpy2D函数,遗憾的是我无法使用。
答案 0 :(得分:4)
cudaMallocPitch
以字节为单位返回分配的间距。所以,如果你这样称呼它:
void *devPtr;
size_t pitch;
cudaMallocPitch ( &devPtr, &pitch, width, height );
内存分配的大小为pitch * height
个字节。