远程群集上的陈旧NFS文件句柄问题

时间:2013-03-25 11:37:24

标签: cluster-computing nfs nsfilehandle gnu-parallel

我需要使用名为ngspice的工具运行一系列模拟,因为我想运行一百万次模拟,我将它们分布在一组机器上(主机+一个从机开始,它有每个12个核心)。

这是命令: ngspice deck_1.sp; ngspice deck_2.sp等,

步骤1:使用python脚本生成这些sp文件。

第2步:Python调用GNU parallel在主/从服务器上分发sp文件,并使用ngspice运行模拟

第3步:我对结果进行后期处理(python脚本)。

我一次只生成和处理1000个文件以节省磁盘空间。因此,上述步骤1到3循环重复,直到模拟了一百万个文件。

现在,我的问题是:

当我第一次执行循环时,我没有问题。文件分布在主/从设备上,直到1000次模拟完成。当循环第二次启动时,我清除现有的sp文件并重新生成它们(步骤1)。现在,当我出于某种奇怪的原因执行第2步时,某些文件未被检测到。经过一些调试后,我得到的错误是“Stale NFS file handle”和“No such file or directory deck_21.sp”等,对于在步骤1中创建的某些sp文件。

我暂停了我的python脚本并在目录中执行了“ls”,我发现这些文件确实存在,但是就像错误指出的那样,这是因为Stale NFS文件句柄。 This link建议我重新安装客户端等,但我登录的是我没有管理员权限的计算机。 有没有办法解决这个问题?

谢谢!

1 个答案:

答案 0 :(得分:1)

没有。您需要管理员权限才能解决此问题。