日志文件显示间歇性成功和失败

时间:2015-05-20 14:59:57

标签: certificate puppet hosts puppet-enterprise

我会首先尝试一个简短版本,然后我可以按要求添加更多信息。

我有一台具有以下配置的客户端计算机:

------------------------------------------------------------
Connected to puppet-client-10 as root
Debian 7.8 wheezy (amd64)
------------------------------------------------------------
FQDN        : puppet-client-10.mydomain
IP          : 161.148.1.10

PuppetMaster: puppet-master.mydomain
Puppet      : 3.7.5
Facter      : 2.2.0
------------------------------------------------------------

连接到下面的puppetmaster:

------------------------------------------------------------
Connected to puppet-master as root
Debian 7.8 wheezy (amd64)
------------------------------------------------------------
FQDN        : puppet-master.mydomain
IP          : 161.148.1.1

Puppet      : 3.7.5
Facter      : 2.4.3
------------------------------------------------------------

现在,回到客户端。 我曾经禁用了代理,并且每天通过cron检查一次更新。

6 22 * * * root /usr/bin/puppet agent --test --logdest syslog

完美无瑕地工作。

2天前,我评论了cron作业,并让代理每小时检查一次更新。

然后,日志开始每2分钟显示一行

<27>1 2015-05-20T08:20:30.651767-03:00 puppet-client-10 puppet-agent 8072 - -  Could not request certificate: getaddrinfo: Name or service not known
<27>1 2015-05-20T08:22:30.668988-03:00 puppet-client-10 puppet-agent 8072 - -  Could not request certificate: getaddrinfo: Name or service not known

此外,显示客户端正在检查主服务器的更新

<28>1 2015-05-20T08:23:44.927447-03:00 puppet-client-10 puppet-agent 31500 - -  Loading class elasticsearch
<28>1 2015-05-20T08:23:45.406158-03:00 puppet-client-10 puppet-agent 31500 - -  Loading class logstash
<28>1 2015-05-20T08:23:45.776948-03:00 puppet-client-10 puppet-agent 31500 - -  Loading class logrotate
<28>1 2015-05-20T08:23:46.204161-03:00 puppet-client-10 puppet-agent 31500 - -  Loading class puppet

然后,每2分钟回到getaddrinfo错误

<27>1 2015-05-20T08:24:30.676307-03:00 puppet-client-10 puppet-agent 8072 - -  Could not request certificate: getaddrinfo: Name or service not known
<27>1 2015-05-20T08:26:30.683570-03:00 puppet-client-10 puppet-agent 8072 - -  Could not request certificate: getaddrinfo: Name or service not known

它在错误(每2分钟)和成功(每小时)消息之间保持交替。

按预期执行命令puppet agent --test有效 问题似乎在代理上。

任何提示?

  

我猜这是因为你的木偶大师没有被命名为“木偶”。   另外,我会检查你现在运行的木偶代理的用户是什么   我认为可能不是root的运行 - Vorsprung

它的名称为puppet-masterpuppet-master.mydomain,以及以下alt名称

# puppet cert list puppet-master.mydomain  

+ "puppet-master.mydomain" (SHA256) F2:54:03:9C 
  (alt names: "DNS:puppet", "DNS:puppet.mydomain", "DNS:puppet-master.mydomain")  

它以root

运行
# ps aux | grep puppet

root      1763  0.0  0.2 133776 45236 ?        Ssl  Mai19   0:07 /usr/bin/ruby /usr/bin/puppet agent
root      8072  0.0  0.2 194580 40144 ?        Ssl  Mai19   0:02 /usr/bin/ruby /usr/bin/puppet agent

目前,8072上面是垃圾邮件错误行的过程。

我真的应该有两个进程在运行吗?

1 个答案:

答案 0 :(得分:3)

错误表示将主机名解析为IP时出现问题,但如果它每小时成功并且手动成功,我认为您的名称解析没有任何配置问题。

您应该只运行一个puppet-agent进程,我将停止puppet-agent服务,确保已杀死所有进程,重新启动puppet-agent服务并确保只有一个进程正在运行。< / p>

我的赌注是其中一个进程愚蠢。