将nvidia驱动程序从384.90升级到384.111后出现CUDA / cuDNN错误

时间:2018-01-10 14:05:33

标签: tensorflow cuda nvidia cudnn

今天早上我使用标准更新程序(使用Update Manager)更新了Mint 18.3 Sylvia(基于Ubuntu xenial 16.04)上的nvidia驱动程序,运行tensorflow 1.4.1时出现此错误:

.setPersistenceEnabled(true)

我使用的是cuda 8.0和cudnn 7.0

为什么以及如何解决它?

1 个答案:

答案 0 :(得分:-1)

经过一段时间的调查,我注意到/ usr / lib / nvidia-384文件夹中有两个断开的链接,仍然指向384.90文件。

所以我刚刚更新了这两个链接:

2018-01-10 13:48:39.161422: E tensorflow/stream_executor/cuda/cuda_dnn.cc:385] could not create cudnn handle: CUDNN_STATUS_INTERNAL_ERROR
2018-01-10 13:48:39.161456: E tensorflow/stream_executor/cuda/cuda_dnn.cc:352] could not destroy cudnn handle: CUDNN_STATUS_BAD_PARAM
2018-01-10 13:48:39.161466: F tensorflow/core/kernels/conv_ops.cc:667] Check failed: stream->parent()->GetConvolveAlgorithms( conv_parameters.ShouldIncludeWinogradNonfusedAlgo<T>(), &algorithms) 

现在它完美无缺。

BTW,我遇到的另一个类似问题是当我从一个主要的驱动程序版本升级到另一个时,如从372到384,忘记在我的脚本中更新LD_LIBRARY_PATH。