如何在HIVE中加入两个表。

时间:2014-09-14 10:56:02

标签: join hadoop hive hiveql

我有两个表A和B,它们都具有以下结构。

// Table A

Name    Age    actualdate    no

// Table B

City    sdate  edate         id

我希望使用JOIN获取A和B中的所有字段,其中,id = no和sdate< = actualdate和edate> = actualdate。

我使用where子句尝试如下,但它不起作用。

select v3.*, t3.* from A v3
JOIN
B t3
where v3.id = t3.no and
      v3.sdate <= t3.actualdate and
      v3.edate >= t3.actualdate
limit 1;

使用On子句:

select v3.*, t3.* from A v3
    JOIN
    B t3
    ON ( v3.id = t3.no and
          v3.sdate <= t3.actualdate and
          v3.edate >= t3.actualdate )
    limit 1;

不幸的是,Hive并不支持equijoin。有没有办法使用连接来实现上述目的?

1 个答案:

答案 0 :(得分:6)

您可以使用WHERE进行过滤,而不是在ON子句中使用&lt; =和&gt; =条件。

select v3.*, t3.* from A t3
JOIN
B v3
ON ( v3.id = t3.no)
WHERE v3.sdate <= t3.actualdate and
      v3.edate >= t3.actualdate
limit 1;

注意:你的t3和v3别名是互换的。