Apache德鲁伊vs雪花

时间:2019-04-29 08:02:13

标签: data-warehouse olap druid snowflake-datawarehouse snowflake

我正在为BI / OLAP选择合适的工具,并且需要了解Snowflake是更适合我的目标还是Druid更合适

当前,我正在使用Snowflake作为数据仓库,它既可用于(1)原始数据查询(具有大量数据集响应),也可用于(2)汇总结果。 为了获得第二种类型的性能,我正在创建其他聚合表,这些表充当OLAP小熊。 我的数据是基于时间的。

但是,此方法需要预先进行额外的工作,以及数据重复和静态查询的要求。 因此,我正在考虑采用apache Druid,它将为聚合提供解决方案。

所以,我的问题是,假设查询将始终包含时间范围,并且我将使用扫描查询,还是必须保留两个数据库,Druid是否也能够代替原始数据集的Snowflake? >

2 个答案:

答案 0 :(得分:0)

我对雪花了解不多,但认为德鲁伊可以涵盖您提到的(1)和(2)的那些功能。我的团队正在基于针对我们BI目的而定制的Druid上开发Metatron Discovery(https://metatron.app)。您可以通过我们的图形界面来检查BI中的Druid性能。还请检查我们的github存储库:https://github.com/metatron-app/metatron-discovery我希望这对您对Druid引擎的了解很少。

答案 1 :(得分:0)

过去1年来,我一直在研究Snowflake,它是目前最好的软件之一。

您没有在Snowflake上获得所需的性能吗? 希望您使用的是大型集群。如果不是,请尝试使用大号并查看性能。