Redshift WLM同时支持Power BI工具和表更新以及最佳选择排序键

时间:2018-07-07 08:14:18

标签: amazon-redshift tableau microstrategy

我有一个有关群集性能的查询(dc2.large节点,1个主节点和2个计算节点)。 800个表中的总数据大小约为100 GB。 现在我关心的是查询的吞吐量,大多数表以5分钟的间隔加载。该群集将在下个月再次为BI工具(Tableau或Microstrategy)供电。我目前有2个关注点:

1)在所有表中,我都有ingested_time列,其中包含时间戳值和status列,其中包含一些已定义的枚举(即1个用于下达订单,2个用于发货,3个用于交付,4个用于取消)。      现在,在这种情况下,我需要选择排序键,我应该选择时间戳还是仅包含联接和where子句中经常使用的键?请建议

P.S。 :我的大多数查询将在where子句中使用时间戳过滤器,并且我已将表中的增量列定义为“分配键”

2)应该如何实施WLM?      截至目前,我有4个队列(3个用户定义一个默认值),并发率为5,内存分别为25%:      i)队列1:用于ETL(数据加载间隔为5分钟)     ii)队列2:用于数据工程师和分析师    iii)队列3:用于BI工具,仪表板和自动报告     我还启用了短查询加速。 请建议我是否需要更改内存分配或队列数。

提前谢谢!因为我担心BI工具,所以我被困在这个时间点上,BI工程师声称他们的查询会使我的集群死掉,而我还不熟悉Redshift。因此非常需要对此进行一些投入。

0 个答案:

没有答案