Tensorflow CUDA-CUPTI错误:无法加载CUPTI或找不到符号

时间:2019-07-02 21:21:35

标签: python tensorflow keras nvidia

我使用Tensorflow v 1.14.0。我在Windows 10上工作。这是环境变量# since Django-2.2 from django.db import models from django.db.models import F, Q from django.db.models.functions import Now class MyModel(models.Model): start = models.DateTimeField() end = models.DateTimeField() def clean(self): # ... pass class Meta: constraints = [ models.CheckConstraint( check=Q(start__lte=F('end'), start__gte=Now()), name='correct_datetime' ), ]中的外观:

PATH

也许还值得一提,以防万一。.我使用Sublime Text 3进行开发,而不使用Anaconda。我发现在conda环境中对tensorflow进行更新有点麻烦,因此我现在仅使用Sublime Text。 (我以前使用的是Anaconda(Spyder),但已从计算机上将其卸载。)

除了偶尔出现一些奇怪的警告,一切似乎都正常。但是,每当我运行C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v10.0\bin C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v10.0\libnvvp C:\Program Files (x86)\NVIDIA Corporation\PhysX\Common C:\Users\sinthes\AppData\Local\Programs\Python\Python37 C:\Users\sinthes\AppData\Local\Programs\Python\Python37\Scripts C:\Program Files\NVIDIA Corporation\NVIDIA NvDLISR C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v10.0\cuda\bin 函数时,都会收到以下一致的警告。

fit

这就是我所说的fit函数:

E tensorflow/core/platform/default/device_tracer.cc:68] CUPTI error: CUPTI could not be loaded or symbol could not be found.

我只是想知道为什么在运行时会看到 history = model.fit(x=train_x, y=train_y, batch_size=BATCH_SIZE, epochs=110, verbose=2, callbacks=[tensorboard, checkpoint, reduce_lr_on_plateau], validation_data=(dev_x, dev_y), shuffle=True, class_weight=class_weight, steps_per_epoch=None, validation_steps=None) 消息?它仅打印一次。这是我需要修复的东西还是可以忽略的东西?此消息并没有告诉我要采取任何措施的具体内容。

8 个答案:

答案 0 :(得分:3)

在Windows的path中添加它:

C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v10.0\extras\CUPTI\libx64

答案 1 :(得分:2)

这是解决“我的”问题的方法:

Windows 10,Tensorflow-gpu 2.4

第一个问题是不清楚它试图加载的确切“哪个”cupti64 版本。考虑到这一点,我搜索了所有名为 cupti*

的 dll

screen-shot1

然后我将它们全部复制(是的,我知道这是 hack,但鉴于信息有限......)到我的

C:\Program Files\NVIDIA GPU 计算工具包\CUDA\v11.0\extras\CUPTI\lib64

文件夹(cupti64_2020.1.0.dll已经在里面了)

screen-shot2

然后我还需要设置文件夹权限才能使其工作,这很奇怪,因为我以管理员身份运行 VS

screen-shot3

答案 2 :(得分:1)

尝试获取张量图时,我遇到了类似的错误,我认为只有在您打算使用张量图时,它才会影响您。

我在这篇文章中找到了解决方案,但它适用于Linux https://gist.github.com/Brainiarc7/6d6c3f23ea057775b72c52817759b25c 我认为您需要为cupti创建一个库配置文件。

答案 3 :(得分:1)

  

NVIDIA®CUDA分析工具界面(CUPTI)是动态的   库,用于创建性能分析和跟踪工具,   目标CUDA应用程序。

CPUTI似乎已由Tensorflow开发人员添加以允许进行分析。如果您不介意异常或调整环境路径,则只需忽略该错误,即可在执行过程中找到动态链接库(DLL)。

在CUDA安装目录内,有一个extras\CUPTI\lib64目录,其中包含试图加载的cupti64_101.dll。将该目录添加到您的路径中即可解决该问题,例如

SET PATH=C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v10.1\extras\CUPTI\lib64;%PATH%

如果您接下来遇到INSUFFICIENT_PRIVILEGES error,请尝试以管理员身份运行程序。

答案 4 :(得分:1)

此答案适用于Ubuntu-16.04

当我使用Tensorflow-1.14Python2.7升级到Python3.6时遇到了这个问题。我必须使用/usr/local/cuda/extras/CUPTI/lib64LD_LIBRARY_PATH添加到export LD_LIBRARY_PATH=/usr/local/cuda/extras/CUPTI/lib64:$LD_LIBRARY_PATH并注销并登录。 source ~/.bashrc没有帮助。请注意,我的cuda文件夹指向cuda-10.0

答案 5 :(得分:1)

遇到了同样的问题。这就是为我修复它的原因,以防其他人遇到类似的问题。

我收到的错误:

function cupti_interface_->Subscribe( &subscriber_, (CUpti_CallbackFunc)ApiCallback, this)failed with error CUPTI could not be loaded or symbol could not be found.
  • Windows Server 2019
  • 张量流 2.5
  • Cuda 11.2(CUDA_PATH 环境变量已设置并添加到 PATH 环境变量中)
  • 库德恩 8.1.0

我已经在 PATH 环境变量中设置了 C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v11.2\extras\CUPTI\lib64,但仍然收到错误。

在 cmd 提示符下运行 where /r c:\ cupti*.dll 会在 c:\Program Files\NVIDIA Corporation\Nsight Systems 2020.4.3\target-windows-x64\ 目录中找到 dll。只需将此目录添加到 PATH 环境变量即可修复错误。

答案 6 :(得分:0)

这是解决“我的”问题的原因:

我刚刚将tensorflow v 1.14替换为tensorflow v 1.13.1。再也没有 CUPTI错误消息。甚至其他一些奇怪的警告/问题也已消失。所有问题显然都应具有特定的原因,但不幸的是(很多时候)Tensorflow并未提供可理解的错误/警告消息,这些消息给出了有助于解决问题的良好/公正的想法。而且我最终花了几个小时(甚至几天)来解决这些奇怪的问题,这大大降低了我的生产率。

对我来说(可以在此处分享)可能是对我的一个一般性学习,那就是我不应该急于将我的tensorflow安装升级到最新版本。最新的版本几乎永远不会稳定,每当我尝试一下时,我都会花大量的时间来解决由tensorflow引起的问题。糟糕的文档和错误消息使使用起来非常困难。

如果有人有更好的答案,非常欢迎他/她对我在此问题中分享的问题发表自己的见解。

答案 7 :(得分:0)

我也刚遇到这个问题,就像 jreeves 一样。我完全按照 jreeves 的方法(上图)解决了它。 (感谢 jreeves 在寻找和记录解决方案方面所做的工作。) 我的设置:

  • Windows 10
  • GPU 支持:正确
  • Cuda 支持:真实
  • TensorFlow:2.4.1
  • Python 版本:3.8.8。
  • 张量板 2.4.1 版。
  • CUDA 11.1
  • 库德恩 8.0.5