我是AWS和大数据的新手。我知道集群或分布式计算的概念。如果有人能够在AWS Docker上阐明Hadoop Cluster的相关信息。谢谢。
答案 0 :(得分:3)
我试着简单地解释一下。
Docker允许您在Containers内运行,构建和测试代码。就是这样。除了您可以在EC2 Container Service中运行Docker容器之外,AWS没有特定的部分。
请注意我在该描述中对Hadoop或大数据一无所知。您的容器可以包含任何打包的应用程序,无论是Web服务器,数据库,构建工具等。
现在,Hadoop可以通过Hive,Hbase,Spark,数据节点和名称节点等分解成容器,只需将每个组件放入单独的容器中并将它们连接在一起形成生态系统。
因此,您可以使用任何或多个计算机上的容器群集,而不是将一组计算机联网在一起。因此,通过共享主机的资源而不是为每个服务提供专用硬件,容器更具可扩展性,轻量级和便携性。