我是HPC集群管理器的新手,可能做的不对,但这是我的问题:
从一开始,我需要说我有2个节点:M-HEADNODE(组:ComputeNodes,HeadNodes)和M-COMPUTENODE(组:ComputeNodes)。他们两个都处于在线状态和 OK Health
我尝试同时使用两个节点(M-HEADNODE,M-COMPUTENODE)使用HPC作业运行一些Python脚本,但是对于第二个节点,我始终遇到以下错误:
Error from node:M-COMPUTENODE:System.Exception: Error when setting password for local account Administrator. Error code: 2245 at Microsoft.Hpc.NodeManager.RemotingExecutor.JobEntryFactory.<GetJobEntryAsync>d_4.MoveNext()
--- End of stack trace from previous location where exception was thrown ---
at System.Runtime.ExceptionServices.ExceptionDispatchInfo.Throw()
at System.Runtime.CompulerServices.TaskAwaiter.HandleNonSuccessAndDebuggerNotification(Task task)
at Microsoft.Hpc.NodeManager.RemotingExecutor.RemotingNMExecImpl.<StartJob>d_39.MoveNext()
如果仅在M-HEADNODE上运行作业,则作业成功完成。我从“新作业”窗口的“ <资源>选择” 部分中选择正在运行的节点。
该错误表明M-COMPUTENODE的凭据有问题,可能是未设置或有误。但是,我不知道是否必须为Node插入一些凭据以及如何使其工作才能使其工作。有什么建议吗?