cudnn path显示7.0.5.15但系统仅识别cudnn 7102

时间:2018-04-13 20:11:25

标签: tensorflow kubernetes gpu

我正在尝试运行一些使用tensorflow-gpu的python代码。但是,当进程尝试运行时,我收到以下错误:

  

2018-04-13 20:03:49.215876:E tensorflow / stream_executor / cuda / cuda_dnn.cc:396]加载的运行时CuDNN库:7102(兼容版本7100)但源代码是用7005编译的(兼容版本7000)。如果使用二进制安装,请升级您的CuDNN库以匹配。如果从源构建,请确保在运行时加载的库与编译配置期间指定的兼容版本匹配。

     

2018-04-13 20:03:49.220783:F tensorflow / core / kernels / conv_ops.cc:712]检查失败:stream-> parent() - > GetConvolveAlgorithms(conv_parameters.ShouldIncludeWinogradNonfusedAlgo(),&算法)

但是,我输入env并列出了CUDNN_VERSION=7.0.5.15LD_LIBRARY_PATH=/usr/local/cuda/extras/CUPTI/lib64:/usr/local/nvidia/lib:/usr/local/nvidia/lib64

我通过下载并将相关文件复制到/user/local/cuda/

来安装cudnn 7.0.5

为什么会出现此错误?我正在使用kubernetes支持的集群

1 个答案:

答案 0 :(得分:0)

我使用 askubuntu

中的post修复了它

在这里粘贴该帖子的说明:

步骤0:从标准存储库安装cuda。 (见How can I install CUDA on Ubuntu 16.04?

第1步:注册一个nvidia开发者帐户和download cudnn here(约80 MB)

步骤2:检查您的cuda安装位置。对于从存储库的安装,它是/usr/lib/.../usr/include。否则,它将是/usr/local/cuda//usr/local/cuda-<version>。您可以使用which nvccldconfig -p | grep cuda

进行检查

第3步:复制文件:

$ cd folder/extracted/contents
$ sudo cp -P include/cudnn.h /usr/include
$ sudo cp -P lib64/libcudnn* /usr/lib/x86_64-linux-gnu/
$ sudo chmod a+r /usr/lib/x86_64-linux-gnu/libcudnn*

基本上,在cudnn安装说明中,它只会告诉您将cudnn.hlibcudnn*文件复制到cuda文件夹。但是,除此之外,还需要在系统主includelib64文件夹中复制这些文件。这将解决这个问题。