如何在hive join中获取不同的值

时间:2017-02-06 05:04:00

标签: hive hiveql

我需要从表2中获取不同的值,同时加入Hive中的表1。因为表2有重复的记录。

考虑下面的连接条件,是否可以从表2中仅采用不同的key_col?我不想使用select distinct * from ...

从表1中选择*左侧连接表_b在a.key_col = b.key_col上

注意:这是在Hive中

1 个答案:

答案 0 :(得分:0)

使用左半连接。这将为您提供table1中存在于table2(重复记录)中的所有记录,而不会重复。

从Table_1中选择一个。* a左侧半连接Table_2 b on a.key_col = b.key_col