我有以下要求:我需要通过Puppet配置Cloudera Manager和Spark Cluster,但之后我需要通过Cloudera Manager UI进行最少(或无)配置。我正在寻找的理想场景如下:
拓扑:3个节点(其中node1为spark-master,node2和node3为spark-workers)
我正在使用razorsedge / cloudera puppet模块来配置Cloudera Manager(https://forge.puppetlabs.com/razorsedge/cloudera),我有定制的Spark puppet模块,它支持CDH5.5 Spark安装
当我打开Cloudera Manager UI时,我可以看到所有三个节点,但我在CM UI仪表板上看不到任何Spark相关的统计信息。
在调查cm代理和服务器日志时,这些是调查结果:
[12 / Jan / 2016 23:13:11 +0000] 4678 MainThread Agent ERROR心跳到EC2_PUBLIC_DNS:7182失败
cm代理登录spark-workers(成功连接到CM服务器,可以在CM UI仪表板上看到)
cm服务器登录spark-master:
org.apache.avro.AvroRuntimeException:未知数据类型:java.lang.IllegalArgumentException:主机名无效EC2_LOCAL_IPV4
知道这可能是什么问题吗?
我也在寻找以下答案:
非常感谢任何帮助/指导