有人可以解释SAP HANA和 SAP HANA Vora 的智能数据访问之间的区别吗?
正如我所说, SDA 只是创建了一些virtual tables
,可以访问外部系统的数据(如Hadoop和ODBC的许多其他数据库),就像它的一部分一样SAP HANA系统(因此您可以使用HANA IDE)并使用"默认数据库引擎"计算并将此外部系统的子结果返回给SAP HANA。
Vora 的概念也是为SAP用户提供对Hadoop系统的访问权限,但子结果是使用Apache Spark的InMemory执行引擎进行计算的。
我读到Hadoop是用于冷数据的完美数据存储(来自SAP HANA的数据比某个时间段早,并且并非所有分析都需要)。但我对这两种数据访问解决方案感到困惑,因为我无法找到重要的区别。
如果您计划在SAP HANA工具编写的一次分析中访问热门(SAP HANA)和冷(Hadoop)数据,哪一种会更好?
您建议将SAP HANA与Hadoop群集结合起来,其中包含Hive表中的数据?
答案 0 :(得分:1)
HANA Vora和SDA是相关的,但实际上是两种不能直接比较的东西。
智能数据访问是HANA中的一项功能/组件,用于连接外部数据源(例如MySQL / Oracle数据库,Vora等)
HANA Vana" HANA Vora"因为Vora实际上是一个不需要HANA运行的独立产品,所以具有误导性。 Vora是Apache Spark的扩展,允许您处理内存中HDFS的数据。此外,Vora的一个主要功能是它与HANA完美集成。它可以使用来自HANA的表格加入其本地表格,反之亦然。
目前Vora不支持INSERT / UPDATE命令,因此您无法直接将冷数据存储的数据从HANA移动到Vora。但是,您可以使用HANA的数据生命周期管理器(DLM)来实现这一点,该博客文章中讨论了这一点:https://blogs.sap.com/2016/02/12/seamless-big-data-tiering-with-hana-hadoop-and-vora-with-a-little-help-from-dlm/