背景:我正在尝试使用tensorflow对各种模型进行推理,由于这个错误,我的脚本总是以失败告终。
错误通常是由描述模型变量的变量文件[/]/model/variables/variables.data-00000-of-00001引起的。
FailedPreconditionError(请参见上文的追溯/模型/变量/变量.data-00000-of-00001; 设备或资源繁忙 [[Node:save / RestoreV2_35 = RestoreV2 [dtypes = [DT_FLOAT],_device =“ / job:localhost /副本:0 / task:0 / device:CPU:0”] [_ arg_save / Const_0_0, 保存/恢复V2_35 /张量名称,保存/恢复V2_35 / shape_and_slices)]] [[节点:save / RestoreV2_17 / _147 = _Recvclient_terminated = false,recv_device =“ / job:localhost /副本:0 / task:0 / device:GPU:0”, send_device =“ / job:localhost /副本:0 / task:0 / device:CPU:0”, send_device_incarnation = 1,tensor_name =“ edge_414_save / RestoreV2_17”, tensor_type = DT_FLOAT, _device =“ / job:localhost /副本:0 / task:0 / device:GPU:0”]]
我怀疑错误来自底层的os(linux)文件系统,在这种情况下为nfs(samba)。
问题是,尽管简单的解决方法似乎是用本地路径替换nfs路径,但是我没有选择的余地,因为模型路径是在运行时定义的,而我不能在本地存储数百GB的模型
是否有一种方法可以调整os / mount选项,而不是仅在本地动态复制整个存储库?
预先感谢您的帮助