安装tensorflow-gpu后,conda无法正常工作

时间:2018-10-20 23:46:59

标签: tensorflow anaconda conda

我正在尝试在GCE上设置GPU支持的VM实例。这是我遵循的步骤。我引用了herehere的步骤。

1。使用Nvidia k80构建虚拟机

2。下载Anaconda3

<div class="grid">
  <div class="cell">Lorem ipsum dolor. Lorem ipsum dolor. Lorem ipsum dolor. Lorem ipsum dolor.</div>
  <div class="cell">Lorem ipsum dolor. Lorem ipsum dolor. Lorem ipsum dolor. Lorem ipsum dolor.</div>
</div>

3。安装CUDA工具包

$ wget http://repo.continuum.io/archive/Anaconda3-4.0.0-Linux-x86_64.sh
$ bash Anaconda3-4.0.0-Linux-x86_64.sh
$ source ~/.bashrc

4。安装cuDNN

$ curl -O https://developer.download.nvidia.com/compute/cuda/repos/ubuntu1604/x86_64/cuda-repo-ubuntu1604_9.0.176-1_amd64.deb
$ sudo dpkg -i cuda-repo-ubuntu1604_9.0.176-1_amd64.deb
$ sudo apt-key adv --fetch-keys http://developer.download.nvidia.com/compute/cuda/repos/ubuntu1604/x86_64/7fa2af80.pub 86_64/ 7fa2af80.pub
$ sudo apt-get update
$ sudo apt-get install -y cuda-9-0 -y 

5。设置路径变量

$ tar -xzvf cudnn-9.0-linux-x64-v7.1.tgz
$ sudo cp cuda/include/cudnn.h /usr/local/cuda/include
$ sudo cp cuda/lib64/libcudnn* /usr/local/cuda/lib64
$ sudo chmod a+r /usr/local/cuda/include/cudnn.h /usr/local/cuda/lib64/libcudnn*

-到目前为止,一切似乎都还不错。

然后我开始下载和安装tensorflow-gpu

6。下载tensorflow-gpu

$ echo 'export CUDA_HOME=/usr/local/cuda' >> ~/.bashrc
$ echo 'export PATH=$PATH:$CUDA_HOME/bin' >> ~/.bashrc
$ echo 'export LD_LIBRARY_PATH=/usr/local/cuda/extras/CUPTI/lib64:$LD_LIBRARY_PATH' >> ~/.bashrc
$ source ~/.bashrc

6-1。第一个错误以及我为使其正常工作所做的事情。

起初,我无法$ sudo apt-get install python3-dev python3-pip libcupti-dev $ sudo pip install --upgrade tensorflow-gpu==1.4.0 ,因为收到一条错误消息:

pip install

我找到了一个解决方案(?)here并执行以下操作:

Traceback (most recent call last):
  File "/usr/bin/pip", line 11, in <module>
    sys.exit(main())
  File "/usr/lib/python2.7/dist-packages/pip/__init__.py", line 215, in main
    locale.setlocale(locale.LC_ALL, '')
  File "/usr/lib/python2.7/locale.py", line 581, in setlocale
    return _setlocale(category, locale)
locale.Error: unsupported locale setting

这样做之后,我可以$ export LANGUAGE=en_US.UTF-8 $ export LANG=en_US.UTF-8 $ export LC_ALL=en_US.UTF-8 $ sudo locale-gen en_US.UTF-8 $ sudo dpkg-reconfigure locales

6-2。第二个错误以及我为使其正常工作所做的事情。

下载后,我在sudo pip install --upgrade tensorflow-gpu==1.4.0中测试了import tensorflow as tf,但它给了我一条消息:

  

ImportError:没有名为“ tensorflow”的模块

搜索答案后,我遇到了this post,并执行了以下命令。

python3

然后,我重新启动了实例。

现在我的tensorflow-gpu可以工作了,但是我认为我所做的一切都搞砸了Conda,因为我再也找不到Conda了。

在尝试重置Conda路径时,我执行了

$ cd /usr/local/cuda
$ sudo ln -s /usr/lib/x86_64-linux-gnu/ lib64
$ sudo ln -s /usr/include/ include
$ sudo ln -s /usr/bin/ bin
$ sudo ln -s /usr/lib/x86_64-linux-gnu/ nvvm
$ sudo mkdir -p extras/CUPTI
$ cd extras/CUPTI
$ sudo ln -s /usr/lib/x86_64-linux-gnu/ lib64
$ sudo ln -s /usr/include/ include

现在我可以使用conda命令(例如$ export PATH=/home/<USER_NAME>/anaconda3/bin:$PATH ),但不能使用conda list

对我来说,感觉就像当我设置import tensorflow as tf时就无法export PATH=/home/<USER_NAME>/anaconda3/bin:$PATH。当我用6-1和6-2解决了tensorflow问题时,则无法使用import tensorflow as tf命令。所以我在做什么都不会使它们兼容...

阅读许多文章和评论后,我猜(不确定)它与路径有关。但是我不知道是什么引起了问题。可能不直接查看我的虚拟机就很难直接解决我的问题,但是有人可以提出任何想法以便我自己检查吗?

0 个答案:

没有答案