我在12节点集群上安装了HDP。我使用了Hortonworks自动ambari安装。一切都在工作,除了Ambari指标收集器。这是我第三次尝试此安装,尝试自定义某些组件的分发位置。每当我遇到无法隔离的错误时,我就会对机器进行重新格式化并再次尝试,每次都会简化。最后一次我没有做任何改动,除了Hive和Oozie数据库的位置。但我仍然遇到与Metrics收集器无法启动相同的问题。我已经没想完了。 来自/var/lib/ambari-agent/data/errors-376.txt的错误文件:
Traceback (most recent call last):
File "/var/lib/ambari-agent/cache/common-services/AMBARI_METRICS/0.1.0/package/scripts/metrics_collector.py", line 131, in <module>
AmsCollector().execute()
File "/usr/lib/python2.6/site-packages/resource_management/libraries/script/script.py", line 219, in execute
method(env)
...
File "/usr/lib/python2.6/site-packages/ambari_jinja2/environment.py", line 891, in render
return self.environment.handle_exception(exc_info, True)
File "<template>", line 5, in top-level template code
UnicodeEncodeError: 'ascii' codec can't encode character u'\u2028' in position 1341: ordinal not in range(128)
我不确定是不是在试图阅读你的问题。我无法找到的模板中的字符,还是其他内容? 我还在/var/lib/ambari-agent/data/output-376.txt中的StdOut中看到以下内容:
...
2016-04-06 06:55:20,967 - Generating config: /etc/ambari-metrics-collector/conf/ams-site.xml
2016-04-06 06:55:20,968 - File['/etc/ambari-metrics-collector/conf/ams-site.xml'] {'owner': 'ams', 'content': InlineTemplate(...), 'group': 'hadoop', 'mode': None, 'encoding': 'UTF-8'}
这里我想知道为什么这个文件不在/ etc / hadoop / conf /或/ usr / hdp / current / hadoop-client / conf /
的其他配置文件中我觉得这在我的设置中是一个简单的错误,因为我已经使用几个月的自动安装在虚拟机上运行了很好的集群。他的安装虽然规模较大,但却装在容量较大的裸机上。 还有其他地方我应该寻找答案吗? 感谢您的帮助或指导。
哦,是的,..我也遇到了三个连接错误:
FQDN:61310 Connection failed [errno 111] Connection refused
0.0.0.0:6188 Connection failed [errno 111] Connection refused
FQDN:61181 Connection failed [errno 111] Connection refused
我将Ambari指标运行起来,至少是暂时的,通过将其模式更改为从嵌入式分发。 Insodoing,当我保存配置更改时,提供了新建议,这些建议多次切换hbase_regionserver_heaqpsize和metrics_collector_heapsize的值。经过大约三到四轮更改值后,我选择了Proceed Anyways,到目前为止它正在运行。