Hive从两个字段匹配的表中选择?

时间:2014-03-17 09:16:34

标签: hadoop hive

我有两个表,都有emailname个字段。如何编写Hive查询,它将返回两个表中具有匹配电子邮件的所有recocrds&

例如:

 Table_1 :
   name x, email e1 
   name y, email e2

Table_2:
  name z, email e3 
  name q, email e2

Result:
  name q, email e2
  name y, email e2

1 个答案:

答案 0 :(得分:0)

使用JOIN。有关JOINS的信息,请参阅此手册页。

https://cwiki.apache.org/confluence/display/Hive/LanguageManual+Joins

您可以编写如下查询:

SELECT * FROM Table_1
LEFT OUTER JOIN Table_2 ON Table_1.email = Table_2.email
LEFT OUTER JOIN Table_3 ON Table_2.email = Table_3.email;

此查询将返回包含匹配电子邮件的所有记录。