我有几个表具有相同的DIST和SORT键,但有许多不同的列名。当Redshift加入表时,我是否仍然可以获得合并连接的好处,还是依赖于具有完全相同名称的列?
例如,假设我有a
的表DISTKEY
和SORTKEY
user_id
; b
DISTKEY
和SORTKEY
distinct_id
distinct_id
,其中user_id
和SELECT a.user_id, a.col1, b.col2
FROM a JOIN b ON (a.user_id = b.distinct_id);
是相同的数据,他们的命名方式不同
map(line => line.split(' ')).map(fields => (fields(0) + "/" + fields(2)))
这会导致合并加入吗?
答案 0 :(得分:1)
是的!只要两个表格中的数据都已排序。
您可以使用"解释'您的查询'"检查查询是否执行散列连接或合并连接。