Theano锁定问题Starcluster

时间:2016-03-14 20:11:57

标签: machine-learning neural-network theano starcluster

当我在Starcluster上运行时,我遇到了一个问题,我创建了一个包含8个节点,一个主节点和7个节点的集群,当我在集群上运行108个神经网络时,他们尝试访问theano编译目录,因为该目录被锁定它会给我以下错误:

INFO(theano.gof.compilelock):要手动释放锁,请删除/data/users/yifeic/.theano/compiledir_Linux - ***** / lock_dir

它尝试多次访问此目录,然后它就会启动该作业。所以我运行了108个神经网络,最后我有大约50个运行。

我尝试了一些更改config.compiledir的内容,以便每个节点都使用自己的目录进行compliledir

和2)使用theano.gof.compilelock.release_lock()强制theano释放锁定

但仍然是starcluster开始工作。

有没有人有过theano和starcluster的经验,或者有过这个锁定问题的经验?

谢谢

0 个答案:

没有答案