Redshift Spectrum使用两个日期字段

时间:2017-10-06 21:36:44

标签: amazon-s3 amazon-redshift amazon-redshift-spectrum

我正在使用amazon-redshift-spectrum搜索按日期创建分区的最佳做法,但示例显示通过仅将表分区一个日期来解决问题。如果我有多个日期字段该怎么办?

例如:user_install_dateevent_date

的移动活动

s3进行分区的效果如何:

   installdate=2015-01-01/eventdate=2017-01-01
   installdate=2015-01-01/eventdate=2017-01-02
   installdate=2015-01-01/eventdate=2017-01-03

它会杀死我select的表现吗?在这种情况下,最好的策略是什么?

1 个答案:

答案 0 :(得分:1)

如果您以上述方式对数据进行了分区,那么WHERE子句中只有eventdate的查询(没有installdate)效率会降低。

它仍然需要查看每个installdate目录,但它可以跳过与谓词不匹配的eventdate目录。

将较少使用的参数放在第二位。