Exasol vs HBase

时间:2015-08-12 08:43:49

标签: hadoop hbase business-intelligence exasolution

我对BigData架构很陌生,所以请不要苛刻我。

我正在努力寻找构建能够处理大量数据的BI架构的最佳替代方案。在我看来,解决方案必须是集群/水平可扩展的,以应对系统的增长。我希望能够使用SQL与系统进行交互,因此HBase + Hive(甚至Pig,不是用于sql但不需要手动编写MR任务)可能是一种解决方案。例如,Exasolution和它们的In-Memory - MPP - Columnar解决方案相反,这种架构的好处/缺点是什么?

是否有其他替代品可能会带来一些额外的好处?那么维护和配置呢?任何Microsoft解决方案(我可能会找到客户特定的需求)

很抱歉发布这样一个未解决的问题,但我希望看到一些讨论,以便我尽可能地向您学习。

1 个答案:

答案 0 :(得分:1)

虽然是EXASOL家伙,但我不会开始试图说服你,EXASOL是唯一一个很好的解决方案。它在很大程度上取决于您尝试实施的用例以及您必须满足的要求。

Hadoop 是一个非常灵活,可扩展的系统,经常用于存储和处理大量数据。

相比之下,

EXASOL 是用于复杂分析查询处理的专用RDBMS。

我认为这两个选项并不真正直接竞争,而是相互补充。在许多情况下,公司需要一个可扩展的数据湖来存储和预处理数据,或者以相当简单的方式查询数据。一旦您想要通过复杂分析进入实时业务,数十,数百甚至数千名分析师正在运行大量查询,那么内存中的RDBMS是一个很好的选择。

Candy Crush的制作人,将这两个世界结合在一个强大的数据管理生态系统中。它们在Hadoop中存储数PB的数据,并在顶部使用EXASOL作为数百TB数据的内存层。您可以在此处详细了解该令人兴奋的用例: http://bit.ly/1TR8APY

这两个世界的另一个重要区别是复杂性。虽然EXASOL是无调优的,因为它是运行SQL查询或R / Python / Java数据库内分析的特定用例的专用系统(类似于设备),但Hadoop堆栈要复杂得多。您需要一定程度的知道如何设置,维护和调整此系统。这不一定是两个选项中的任何一个的原因。如上所述,它在很大程度上取决于你想要的东西。

价格角度,Hadoop是免费的,因此它应该比内存数据库(如EXASOL)便宜得多,对吧?等一下,这并不容易。同样,你必须考虑整个画面。您真正想要存储多少数据,需要查询多少数据才能进行分析,您需要购买多少硬件,您需要雇佣多少人来接受培训以及部署在系统上的分析。

<强>摘要

总结一下我的想法,世界太复杂,无法直接比较这两种技术。根据用例和您的个人要求,其中一个或另一个可能是更好的选择。在我看来,市场的趋势是将这些系统与数据管理生态系统相结合,在这两个世界中,您可以充分利用这两个世界......实际上是三个世界,因为NoSQL解决方案的运营数据处理世界也应该是这里提到。

我希望有所帮助。如果您需要任何有关EXASOL的更多详细信息,请随时与我联系或在LinkedIn上与我联系: de.linkedin.com/in/exagolo