我需要从表2中获取不同的值,同时加入Hive中的表1。因为表2有重复的记录。
考虑下面的连接条件,是否可以从表2中仅采用不同的key_col?我不想使用select distinct * from ...
从表1中选择*左侧连接表_b在a.key_col = b.key_col上
注意:这是在Hive中
答案 0 :(得分:0)
使用左半连接。这将为您提供table1中存在于table2(重复记录)中的所有记录,而不会重复。
从Table_1中选择一个。* a左侧半连接Table_2 b on a.key_col = b.key_col