我正在尝试运行一些使用tensorflow-gpu
的python代码。但是,当进程尝试运行时,我收到以下错误:
2018-04-13 20:03:49.215876:E tensorflow / stream_executor / cuda / cuda_dnn.cc:396]加载的运行时CuDNN库:7102(兼容版本7100)但源代码是用7005编译的(兼容版本7000)。如果使用二进制安装,请升级您的CuDNN库以匹配。如果从源构建,请确保在运行时加载的库与编译配置期间指定的兼容版本匹配。
2018-04-13 20:03:49.220783:F tensorflow / core / kernels / conv_ops.cc:712]检查失败:stream-> parent() - > GetConvolveAlgorithms(conv_parameters.ShouldIncludeWinogradNonfusedAlgo(),&算法)
但是,我输入env
并列出了CUDNN_VERSION=7.0.5.15
和LD_LIBRARY_PATH=/usr/local/cuda/extras/CUPTI/lib64:/usr/local/nvidia/lib:/usr/local/nvidia/lib64
我通过下载并将相关文件复制到/user/local/cuda/
为什么会出现此错误?我正在使用kubernetes支持的集群
答案 0 :(得分:0)
我使用 askubuntu
中的post修复了它在这里粘贴该帖子的说明:
步骤0:从标准存储库安装cuda。 (见How can I install CUDA on Ubuntu 16.04?)
第1步:注册一个nvidia开发者帐户和download cudnn here(约80 MB)
步骤2:检查您的cuda安装位置。对于从存储库的安装,它是/usr/lib/...
和/usr/include
。否则,它将是/usr/local/cuda/
或/usr/local/cuda-<version>
。您可以使用which nvcc
或ldconfig -p | grep cuda
第3步:复制文件:
$ cd folder/extracted/contents
$ sudo cp -P include/cudnn.h /usr/include
$ sudo cp -P lib64/libcudnn* /usr/lib/x86_64-linux-gnu/
$ sudo chmod a+r /usr/lib/x86_64-linux-gnu/libcudnn*
基本上,在cudnn
安装说明中,它只会告诉您将cudnn.h
和libcudnn*
文件复制到cuda
文件夹。但是,除此之外,还需要在系统主include
和lib64
文件夹中复制这些文件。这将解决这个问题。