tensorflow.python.framework.errors_impl.FailedPreconditionError:设备或资源繁忙

时间:2018-09-18 08:14:07

标签: tensorflow nfs samba

背景:我正在尝试使用tensorflow对各种模型进行推理,由于这个错误,我的脚本总是以失败告终。

错误通常是由描述模型变量的变量文件[/]/model/variables/variables.data-00000-of-00001引起的。

  

FailedPreconditionError(请参见上文的追溯/模型/变量/变量.data-00000-of-00001;   设备或资源繁忙            [[Node:save / RestoreV2_35 = RestoreV2 [dtypes = [DT_FLOAT],_device =“ / job:localhost /副本:0 / task:0 / device:CPU:0”] [_ arg_save / Const_0_0,   保存/恢复V2_35 /张量名称,保存/恢复V2_35 / shape_and_slices)]]            [[节点:save / RestoreV2_17 / _147 = _Recvclient_terminated = false,recv_device =“ / job:localhost /副本:0 / task:0 / device:GPU:0”,   send_device =“ / job:localhost /副本:0 / task:0 / device:CPU:0”,   send_device_incarnation = 1,tensor_name =“ edge_414_save / RestoreV2_17”,   tensor_type = DT_FLOAT,   _device =“ / job:localhost /副本:0 / task:0 / device:GPU:0”]]

我怀疑错误来自底层的os(linux)文件系统,在这种情况下为nfs(samba)。

问题是,尽管简单的解决方法似乎是用本地路径替换nfs路径,但是我没有选择的余地,因为模型路径是在运行时定义的,而我不能在本地存储数百GB的模型

是否有一种方法可以调整os / mount选项,而不是仅在本地动态复制整个存储库?

预先感谢您的帮助

0 个答案:

没有答案