Azure DevOps 自托管代理错误连接问题

时间:2021-02-10 09:22:45

标签: azure azure-devops azure-devops-self-hosted-agent azure-devops-pipelines

我们正在使用 Azure DevOps 自托管代理来构建和发布我们的应用程序。我们经常看到 以下错误并自动恢复。有谁知道这个错误是什么,如何解决这个问题以及在哪里可以准确地检查有关错误的日志?

We stopped hearing from agent <agent name>. Verify the agent machine is running and has a healthy network connection. Anything that terminates an agent process, starves it for CPU, or blocks its network access can cause this error. For more information, see: https://go.microsoft.com/fwlink?Linkid=846610

1 个答案:

答案 0 :(得分:1)

这似乎是自托管代理和 Microsoft 托管代理的一个已知问题,许多人都reporting

引用来自 Azure Pipelines 产品组的 @zachariahcox 的回复:

<块引用>

为了提供一些上下文,azure 管道代理由两个 进程:agent.listeneragent.worker(每个进程中的一个 step 中的 job)。侦听器负责报告 工人仍在取得进展。如果 agent.listener 无法 与服务器通信 10 分钟(我们尝试 每分钟沟通一次),我们假设出了问题,然后 放弃工作。

所以,如果您运行的是私人机器,任何可能干扰的事情 侦听器与我们的服务器通信的能力将 有问题。

我见过的问题之一是防病毒程序将其识别为 威胁,本地代理以各种方式行事,物理机 内存或磁盘空间不足(很常见),机器 意外重启,有人 ctrl+c'ing 整个监听器进程, 工作负载以比侦听器更高的优先级运行 (因此“饿死”监听器),单元测试关闭网络 适配器(很常见),在正常优先级上有太多代理 同一台机器,所以他们互相挨饿,等等。

如果您认为您看到的问题无法用任何方法解释 以上(从 _diag 日志文件夹中没有任何内容跳出来), 请在 https://azure.microsoft.com/en-us/support/devops/

如果您的代理似乎一切正常,而且 Pipeline troubleshooting guide 帮助中提到的步骤都没有,请在 Developer Community 上报告,Azure DevOps 团队和 DevOps 社区正在积极回答问题。