我最近将我的一个小型ubuntu(16.04)服务器从tensorflow-gpu 1.4升级到tensorflow-gpu 1.5,以便使用对象检测API。我有git克隆了最新版本的API,它应该与tensorflow 1.5配合使用。
CUDA / cudNN和其他tensorflow程序在升级后启动并运行,并且对象检测API中的所有测试脚本都运行正常。
尽管如此,当我尝试运行train.py时,它立即失败并出现以下错误:
File "/home/arvid/ownCloud/tensorflow/models/research/object_detection/train.py", line 167, in <module> tf.app.run()
File "/usr/local/lib/python3.5/dist-packages/tensorflow/python/platform/app.py", line 124, in run _sys.exit(main(argv))
File "/home/arvid/ownCloud/tensorflow/models/research/object_detection/train.py", line 107, in main overwrite=True)
File "/usr/local/lib/python3.5/dist-packages/tensorflow/python/lib/io/file_io.py", line 385, in copy compat.as_bytes(oldpath), compat.as_bytes(newpath), overwrite, status)
File "/usr/local/lib/python3.5/dist-packages/tensorflow/python/framework/errors_impl.py", line 473, in __exit__ c_api.TF_GetCode(self.status.status))
tensorflow.python.framework.errors_impl.NotFoundError: ; No such file or directory
当某些输入文件丢失时会出现此错误,但此处的问题是错误中未指定任何文件。
通常在逗号和分号之间显示丢失的文件,但在此错误中它只是一个空格。
我可以在运行tensorflow 1.4的工作服务器上重现相同的错误,方法是在--train_dir =和路径之间插入一个空格:
--train_dir= {some_path}
但事实并非如此!
其他信息:当我运行train.py时,列车是&#39;目录是在我指定的位置创建的,因此tensorflow似乎能够识别路径等。
有关如何调试此内容的任何输入都将非常感谢!!
答案 0 :(得分:0)
(好吧,我现在感觉有点愚蠢......)
解决方案很简单 - train.py标志的名称随更新而改变......
过去是:
steps {
shell('./smoketest.sh')
}
但是现在它:
--pipeline_config={some_path}
但是,如果有更多信息性错误消息,那将会非常有用......
答案 1 :(得分:0)
在--train_dir= {some_path}
和--pipeline_config_path= {some_path}
之间划出一些空格。
它对我有用。