如何查看 NCCL 的版本

时间:2021-04-07 11:05:51

标签: python tensorflow nvidia horovod

我正在远程访问高性能计算节点。我不确定 NVIDIA 集体通信库 (NCCL) 是否安装在我的目录中?有没有办法检查NCCL

2 个答案:

答案 0 :(得分:3)

如果您使用 PyTorch,您可以尝试 locate nccl| grep "libnccl.so" | tail -n1 | sed -r 's/^.*\.so\.//'torch.cuda.nccl.version()

查看此链接 Command Cheatsheet: Checking Versions of Installed Software / Libraries / Tools for Deep Learning on Ubuntu

答案 1 :(得分:0)

您通常可以在命令行中执行此操作:

nvcc --version

您可能必须运行:

sudo apt install nvidia-cuda-toolkit

也是。


正如其他回答者提到的,你可以这样做:

torch.cuda.nccl.version()

在pytorch中。将其复制粘贴到您的终端中:

python -c "import torch;print(torch.cuda.nccl.version())"

我确信 tensorflow 中有类似的东西。