Win7上的Condor:连接问题(Errno 10054)

时间:2014-07-09 06:51:00

标签: io condor

我已根据本指南在几台Win7(32/64位)计算机上安装了condor 8.2.0:http://www.slideshare.net/gtelzur/condor8-win-install所有服务都在同一台计算机上运行,​​因此我排除了物理网络中断。

每当创建/提交作业时,它都处于空闲模式。详细查看日志文件揭示了以下问题(ShadowLog):

07/07/14 08:10:47 (1.1) (PID1): **** condor_shadow (condor_SHADOW) pid PID1 EXITING WITH STATUS 107
07/07/14 08:10:47 (1.0) (PID2): condor_read() failed: recv(fd=540) returned -1, errno = 10054 , reading 5 bytes from startd slot1@mycomputer.mydomain.local.
07/07/14 08:10:47 (1.0) (PID2): IO: Failed to read packet header
07/07/14 08:10:47 (1.0) (PID2): Can no longer talk to condor_starter <192.168.25.120:56186>

我无法找到有关ID为10054的IO异常的更多详细信息。除此之外,如果我搜索&#34; Condor IO:无法读取数据包标题&#34;那么Google不会给我有用的提示。< / p>

你有什么可以解决这个问题的线索吗?

2 个答案:

答案 0 :(得分:1)

我遇到了同样的问题,当我在C:\Condor中重新安装了Condor时,我已经解决了这个问题(它位于D:\Condor)。

请注意,对于Condor 8.2.1,我遇到了一个无关的问题:我必须编辑condor_config文件并删除行CONDOR_HOST = $$(FULL_HOSTNAME)中的一个$,否则会出现解析错误。< / p>

答案 1 :(得分:1)

当你看到

condor_read() failed: .... reading 5 bytes from .....

在其中一个日志文件中,这通常意味着连接的另一端挂起,因此您应该在日志文件中查找转换的另一面。在这种情况下,那就是 mycomputer.mydomain.local 上的 StarterLog.slot1 (或者可能只是 StarterLog ,如果问题发生的话早)。

通常当守护进程挂断时,挂起的原因在于日志,而且问题通常是对话的另一方未经授权。请参阅与ALLOW_ *匹配的配置值以查看已授权的内容。