我正在使用amazon-redshift-spectrum
搜索按日期创建分区的最佳做法,但示例显示通过仅将表分区一个日期来解决问题。如果我有多个日期字段该怎么办?
例如:user_install_date
和event_date
对s3
进行分区的效果如何:
installdate=2015-01-01/eventdate=2017-01-01
installdate=2015-01-01/eventdate=2017-01-02
installdate=2015-01-01/eventdate=2017-01-03
它会杀死我select
的表现吗?在这种情况下,最好的策略是什么?
答案 0 :(得分:1)
如果您以上述方式对数据进行了分区,那么WHERE子句中只有eventdate
的查询(没有installdate
)效率会降低。
它仍然需要查看每个installdate
目录,但它可以跳过与谓词不匹配的eventdate
目录。
将较少使用的参数放在第二位。