应用错误收集

背景：我正在尝试使用tensorflow对各种模型进行推理，由于这个错误，我的脚本总是以失败告终。

错误通常是由描述模型变量的变量文件[/]/model/variables/variables.data-00000-of-00001引起的。

FailedPreconditionError（请参见上文的追溯/模型/变量/变量.data-00000-of-00001; 设备或资源繁忙 [[Node：save / RestoreV2_35 = RestoreV2 [dtypes = [DT_FLOAT]，_device =“ / job：localhost /副本：0 / task：0 / device：CPU：0”] [_ arg_save / Const_0_0，保存/恢复V2_35 /张量名称，保存/恢复V2_35 / shape_and_slices）]] [[节点：save / RestoreV2_17 / _147 = _Recvclient_terminated = false，recv_device =“ / job：localhost /副本：0 / task：0 / device：GPU：0”， send_device =“ / job：localhost /副本：0 / task：0 / device：CPU：0”， send_device_incarnation = 1，tensor_name =“ edge_414_save / RestoreV2_17”， tensor_type = DT_FLOAT， _device =“ / job：localhost /副本：0 / task：0 / device：GPU：0”]]

我怀疑错误来自底层的os（linux）文件系统，在这种情况下为nfs（samba）。

问题是，尽管简单的解决方法似乎是用本地路径替换nfs路径，但是我没有选择的余地，因为模型路径是在运行时定义的，而我不能在本地存储数百GB的模型

是否有一种方法可以调整os / mount选项，而不是仅在本地动态复制整个存储库？

预先感谢您的帮助

tensorflow.python.framework.errors_impl.FailedPreconditionError：设备或资源繁忙

0 个答案: