我正在远程访问高性能计算节点。我不确定 NVIDIA 集体通信库 (NCCL) 是否安装在我的目录中?有没有办法检查NCCL
答案 0 :(得分:3)
如果您使用 PyTorch,您可以尝试 locate nccl| grep "libnccl.so" | tail -n1 | sed -r 's/^.*\.so\.//'
或 torch.cuda.nccl.version()
答案 1 :(得分:0)
您通常可以在命令行中执行此操作:
nvcc --version
您可能必须运行:
sudo apt install nvidia-cuda-toolkit
也是。
正如其他回答者提到的,你可以这样做:
torch.cuda.nccl.version()
在pytorch中。将其复制粘贴到您的终端中:
python -c "import torch;print(torch.cuda.nccl.version())"
我确信 tensorflow 中有类似的东西。