Docker容器中的Hadoop更快/值得吗?

时间:2016-02-06 19:42:21

标签: hadoop docker cassandra cloudera

我有一个基于Hadoop的环境。我在此系统中使用FlumeHueCassandra。现在围绕Docker大肆宣传,所以想要研究一下这种情况下码头化的利弊。我认为它应该更加便携,但只需点击几下即可使用Cloudera Manager进行设置。它可能更快还是为什么值得?有什么好处? 也许应该只有多节点Cassandra群集停靠?

1 个答案:

答案 0 :(得分:3)

  

它可能更快还是为什么值得?

听起来你已经有了一个Hadoop集群。所以你必须问自己,重现这个环境需要多长时间?您需要多久重现一次这种环境?

如果您不需要重复重现环境并且包含可能与主机上的其他应用程序冲突的依赖项的方法,那么我还没有看到您的用例。

  

有什么好处?

如果您在可能需要混合Java版本的环境中运行Hadoop,那么将其作为容器运行可以将依赖项(在本例中为Java)与主机系统隔离开来。在某些情况下,它会为您提供一个更容易重现的工件来移动和设置。但Java应用程序已经非常简单,其中所有依赖项都包含在JAR中。

  

也许应该只有多节点Cassandra集群停靠?

我认为这不是真正归结为是否是多节点环境。它归结为它解决的问题。听起来你在部署或复制Hadoop环境时没有任何痛点,所以我认为不需要“停顿”某些东西只是因为它是块上的热门新东西。

如果您确实需要轻松地重现Hadoop环境,您可以查看Docker的一些编排和管理工具(Kubernetes,Rancher等),这些工具可以在覆盖网络上部署和管理应用程序集群。比普通的Docker更开胃。 Docker只是我眼中的工具。当你可以利用其他软件包在其上构建的一些整洁的叠加多主机网络,发现和编排时,它真的开始闪耀。