我有一个带扭矩的集群来分配作业。我想用tensorflow代码运行一个作业,我遇到了tensorflow无法识别的问题。
我使用anaconda在我的LDAP用户上安装了tensorflow,因此我可以在任何节点中输入tensorflow环境并手动运行我的代码。我的问题是扭矩作业在运行时没有打开conda环境,因此我得到“ImportError:没有名为tensorflow的模块”并且我的代码没有运行。所以他们pythons代码确实运行但是当我在python中导入时无法找到tensorflow模块,因为它不在tensorflow conda环境中运行
如何告诉节点在tensorflow conda环境中运行我的python文件?
This is how my torque job file looks
注意:这里我尝试运行打开环境的命令,在其他版本中我没有。
提前感谢您提供的任何帮助。
答案 0 :(得分:0)
我最后只是需要添加我的pbs文件并导出到我的conda bin文件夹bin文件夹的路径,所以它将使用我的conda环境python二进制文件运行python。
此外,我与此无关,但可能仍然与执行此操作的人员相关我最终还需要导出我的cuda bin目录。
我添加了什么:
export PATH="/home/my_user/anaconda3/bin:$PATH"
export PATH=$PATH:/usr/local/maui/bin:/usr/local/maui/sbin
export PATH=$PATH:/usr/local/cuda-8.0/bin