来自问题的TensorFlow

时间:2017-08-18 11:20:54

标签: linux tensorflow

我正在使用Fedora 26发行版

  • kernel:4.12.5
  • gcc:5.4(5.3.1是推荐的,但我找不到它@ gnu's)
  • bazel:0.5.3which bazel输出/usr/local/bin/bazel
  • 路径:....:/usr/local/bin:.....
  • CUDA 8.0

我从TensorFlow的存储库中克隆了git,使用以下内容运行./configure(仅保留了essntials):

lease specify the location where CUDA 8.0 toolkit is installed. Refer to README.md for more details. [Default is /usr/local/cuda]: /usr
Please specify the location where cuDNN 5 library is installed. Refer to README.md for more details. [Default is /usr]:/usr/local/cudnn
Please specify which gcc should be used by nvcc as the host compiler. [Default is /usr/bin/gcc]: /home/elior/gcc54/bin/gcc

如果需要更多信息,请通知我,我会发布。配置似乎现在已经完成,当我运行时

bazel build --config=opt --config=cuda //tensorflow/tools/pip_package:build_pip_package

我收到以下错误

  

......   Cuda配置错误:存储库命令失败   find:'/ usr / nvvm':没有这样的文件或目录

现在很少有我能想到的可能出错的事情。

  1. 使用which nvcc输出/usr/bin/nvcc但是当配置要求我提供CUDA编译器的路径时,我回复/usr/bin/nvcc它说无法找到/usr/bin/nvcc/lib64/libcudart.so.8.0,所以我进行了搜索,然后在/usr/lib64/libcudart.so.8.0找到了该文件,这就是为什么我将路径设为/usr
  2. 与cudNN几乎相同,我从网站上下载了5.1,然后我将其提取到/usr/local/cudnn但是当我输入cudNN版本时我想用它作为5.1它找不到{{ 1}}但我确实有5.0,所以我只说“5”作为版本,它就可以了。
  3. 这就是我现在所能提出的所有内容......但我真的想完成这项安装,任何帮助都会受到赞赏。

3 个答案:

答案 0 :(得分:1)

  

请指定安装CUDA 8.0工具包的位置。有关更多详细信息,请参阅README.md。 [默认为/ usr / local / cuda]:/ usr

这里你需要找到cuda安装目录的路径;这是 /usr/local/cuda(因为它也是默认值);现在你把它设置为/usr这是错误的;要么将其保留为默认值,要么将其设置为/usr/local/cuda

  

请指定cuDNN 5库的安装位置。有关更多详细信息,请参阅README.md。 [默认为/ usr]:/ usr / local / cudnn

此处您需要设置的常用路径为/usr/local/cuda/

  

cudnn install

cp cudnn/lib64/cudnn* /usr/local/cuda/lib64
cp cudnn/include/* /usr/local/cuda/include

答案 1 :(得分:0)

解决方法的排序 - 使用docker

nvidia-docker

tensorflow docker image

答案 2 :(得分:0)

我们在这个GPU上花了太多天/小时。希望我们可以通过分享以下链接来节省您的时间:

AWS + Docker + CUDA + CuDNN + GPU + Spark + TensorFlow + JupyterHub

https://github.com/fluxcapacitor/pipeline/wiki/AWS-GPU-Tensorflow-Docker

Google + Docker + CUDA + CuDNN + GPU + Spark + TensorFlow + JupyterHub

https://github.com/fluxcapacitor/pipeline/wiki/GCP-GPU-TensorFlow-Docker

我们将这些说明用于聚会和会议等。并且我们会在内容中断时更新它们 - 不幸的是,这些内容经常涉及所有可移动部件。

我们引用的Docker镜像在这里:https://github.com/fluxcapacitor/pipeline/blob/master/gpu.ml/Dockerfile.gpu

此Docker镜像从此扩展:https://github.com/fluxcapacitor/pipeline/blob/master/package/gpu/cuda8/16.04/Dockerfile

延伸自这个Nvidia Base Docker Image:FROM nvidia / cuda:8.0-cudnn6-devel-ubuntu16.04

这个Nvidia Base Docker Image已经包含了CuDNN库。

我们需要从源代码构建TensorFlow,因为我们使用了大量必须从源代码构建的TensorFlow性能优化实用程序。

希望有所帮助!更多详细信息和参考资料可在GitHub和DockerHub repos参考:http://pipeline.ai