如果在cudaGetDeviceCount
mpirun
-np
大于2
时使用bool cpuInterfaces::checkGPUCount(int gpusPerMachine){
int GPU_N;
cudaGetDeviceCount(&GPU_N);
//if the gpu count on this node does not equal what was given in fvSolution, return false
return ((gpusPerMachine>GPU_N || gpusPerMachine < 1)? false : true);
}
,我会遇到一些问题。来自更大程序的代码部分是:
mpirun -np 2 somethingsomething
代码的较大部分位于cufflink-source file。如果使用cudaGetDeviceCount
执行运行,那么一切正常,4
返回mpirun -np 4 somethingsomething
,好像cudaGetDeviceCount
将导致cudaGetDeviceCount
返回零。是否有在MPI中使用{{1}}的特殊情况我不知道?任何帮助或建议都会有所帮助。
答案 0 :(得分:1)
感谢那些提供了一些答案的人。事实证明这是一个驱动程序的问题。等待了一下后,驱动程序更新解决了这个问题。