我目前负责让tensorflow-gpu 1.8在我的机器上工作。我一直在使用tf-gpu 1.2,但由于一些必需的功能,我必须升级我的安装。
在此之前,我想检查一下是否有最好的做法。我目前的设置如下:
正如在tf-homepage上所写,我将不得不使用CUDA v9.0以及cuDNN v7.1。由于所有这些说明都指的是全新安装而非更新,我不确定是否最好先卸载旧版本。
如果您遇到同样的问题,请分享您的经验。谢谢!
答案 0 :(得分:3)
谢谢@joãogabriels.f.我能够成功卸载CUDA 8.0 / cuDNN 5.1并安装最新版本的tensorflow。由于整个程序对我来说有点混乱,我决定发布一个快速的演练,也许可以帮助处于相同情况的人。
<强> DEINSTALL 强>
首先,我卸载了cuda及其所有依赖项。当我通过包管理器安装它时,我使用apt-get删除它。对于runfile安装,您可以检查this。
sudo apt-get --purge remove cuda
sudo apt-get autoremove
dpkg --list |grep "^rc" | cut -d " " -f 3 | xargs sudo dpkg --purge
另外,我检查了/usr/local/
中的任何cuda文件夹并将其删除。关于cuDNN,通过删除所有cuda文件夹,删除了相应的cuda标头和库。
安装强>
首先检查显卡的驱动程序。 CUDA 9.0与v384.111驱动程序一起使用(所以不需要390.xxx),所以我在这里无事可做。
我下载了CUDA Toolkit 9.0 here作为deb(本地)。在同一个文件夹中,我执行了
dpkg -i cuda-repo-ubuntu1604-9-0-local_9.0.176-1_amd64-deb
sudo apt-key add /var/cuda-repo-9-0-local/7fa2af80.pub
sudo apt-get update
sudo apt-get install cuda
然后设置环境变量:
export PATH=${PATH}:/usr/local/cuda-9.0/bin
export CUDA_HOME=${CUDA_HOME}:/usr/local/cuda:/usr/local/cuda-9.0
export LD_LIBRARY_PATH=${LD_LIBRARY_PATH}:/usr/local/cuda-9.0/lib64
之后我按照here所述验证了我的安装。
我从存档中下载了cuDNN 7.1作为tarball并通过
安装tar -xzvf cudnn-9.0-linux-x64-v7.1.tgz
sudo cp cuda/include/cudnn.h /usr/local/cuda/include
sudo cp cuda/lib64/libcudnn* /usr/local/cuda/lib64
sudo chmod a+r /usr/local/cuda/include/cudnn.h \
/usr/local/cuda/lib64/libcudnn*
启动Python bash后,我能够导入tensorflow并运行一个简单的图形。
再次感谢,祝你有愉快的一周!
答案 1 :(得分:1)
见this documentation。他们说要先从cuda中删除旧版本。
并且因为cuda 9.1需要驱动程序&gt; = 390版本。删除当前的驱动程序会很好。 但不用担心,因为390驱动程序在安装时附带了cuda 9.1。
现在,作为个人建议,我会说要删除与nvidia / cuda相关的几乎所有内容(不包括python)。在Ubuntu中安装和设置CUDA时,由于某些原因很容易弄乱它。
如果您在安装后遇到任何问题,请参阅ubuntu-16-04-lts-login-loop-after-updating-driver-nvidia,这是我之前回答的帖子。