Aster Data中的所有组件似乎在Hadoop堆栈中都有类似的组件。
AFS => HDFS
SQL-MR =>蜂房
AMC => Ambari
ACT => beeline / hive终端
用于存储元数据的Postgres =>可以将Hive配置为在任何RDBMS中存储元数据
女王/工人=>的NameNode / Datanode的
SQL-GR => Giraph
除了提供预先构建的功能包之外,Hadoop中是否有任何明显不同的内容?
答案 0 :(得分:2)
你的问题不错,这是错的。可能来自Hadoop方面,您使用Hadoop架构提出了问题,Hadoop架构是分层和/或集成的独立组件的组合,每个组件都有自己的功能规范,配置和执行环境等。
为什么这是错的?因为如果比较Hadoop和Oracle或SAP数据库,你不会问同样的问题,对吗?
是的,Aster方面的每个对应方都与Hadoop堆栈产品相匹配 - 区别在于Aster没有这样的堆栈(至少从6.x开始)。 Aster是匹配Hadoop堆栈功能的数据库和分析引擎,但不是组件。
例如,ACT是一个命令行实用程序,类似于SQL * Plus for Oracle,通过客户端/服务器接口运行。它与Hadoop之上的Hive基础架构完全不同。 Aster文件系统是Aster软件中集成的复杂可插拔功能层 - 而不是HDFS和Hadoop的独立框架和软件。
最显着的区别在于Aster分析引擎由SQL,SQL / MR和SQL / GR组成。这意味着数据存储与其数据存储上运行的运算符(SQL语句,SQL / MR或SQL / GR函数)之间没有功能或操作上的差距 - 它们存在于同一环境中(配置,执行,维护,支持)。例如,基于列和基于行的表对于对它们执行的任何操作都是完全透明的(禁止先验和设计定义的约束)。
所以,你的类比确实解释了Hadoop方面的一致性而没有给Aster带来适当的效果。
答案 1 :(得分:0)
我认为你不必要地为了实现这一点。问题是概念上的。说Netezza和Teradata MPP。在基本概念中它们是相同的并且它们执行相同类型的工作,但它们是两种不同的物理实现,具有自己的算法,存储,索引等。
在非常高的层次上,Hive和Aster具有相似性,因为它们都在分布式存储上运行map reduce。
非常高级别的唯一区别是,在非常高的级别,Aster可以运行典型的RDMS查询以及隐式映射,因为Hive只是map reduce。