我是Amazon Redshift的新手。试图找出在redshift中加入两个表的最佳方法
我有1个表有23亿条记录,id列有数据类型varchar(40),带有排序键和dist键
左边连接与其他表有相同列id的2300万条记录 - 排序键和dist键
查询需要数小时才能执行。我在这里做错了什么?
答案 0 :(得分:1)
查看您是否在STL_ALERT_EVENT_LOG表上有警报,您还可以在查询中使用“EXPLAIN”并检查您的查询是否通常使用最快的连接(合并连接)。您还应该识别具有数据倾斜或未排序行的表(请参阅Redshift文档)