我有一个RHEL7服务器,我正在其中尝试创建一个用于POC和学习目的的通用datalake平台。我分别设置了 Hadoop,Hive,Zookeeper,Kafka,Spark,Sqoop 。
单独安装这些组件是一件很棘手的事情,尽管这是出于内部目的,而不是特定于生产的,但仍需付出大量努力。
我现在正尝试在此服务器中安装CDH软件包。 有可能这样做吗?它会与当前安装重叠吗? 如何做到这一点。
注意:之所以我们进行单独安装是因为该时间点服务器中的Internet不可用。
原因之所以现在选择CDH,是因为在获得某些批准后的几天内,由于Internet可用,加上CDH节省了大量时间和精力,并且包括 设置数据湖所需的组件。
有人可以在这里帮我吗?
答案 0 :(得分:0)
是的,可以在不干扰docker的情况下设置CDH的可行性。请查看以下链接以获取安装指南。我已经对此进行了测试,即使我设置了单独的工具,它也可以正常工作。
https://www.cloudera.com/documentation/enterprise/5-6-x/topics/quickstart_docker_container.html