我有两个表t1(15.6m行)t2(22m行)都包含我想在SELECT中使用的属性地址。但是,这两个表使用不同的列格式来存储地址;
t1 has c1 with string 'apartment 1 building name' then c2 'street'
and c3 as 'apartment 1 building name street'
t2 has c1 with string 'building name' c2 as 'apartment 1' c3 as 'street'
要加入这两个数据集,我理解我的选项是在t2中添加新列c4,它使用c2 c1 c3上的CONCAT
来匹配t1中c4的格式。或者在t1 c1上使用REGEX SPLIT
,因此它们遵循t2的格式。
哪种方法更好。最终输出将是物化视图,其中两个表都与地址匹配