加入两个表并在hive中的新表中插入值

时间:2015-07-10 04:15:38

标签: hadoop hive hiveql

我是新手。我需要知道它是否可以在hive中连接两个表(比如基于CustomedId列的customer_table和issues_table)并使用insert overwrite在hive中的新表中插入值?

2 个答案:

答案 0 :(得分:1)

是的,可以使用CTAS(create table new_table as select ...)语法。

  

将table new_table创建为select * from customer_table,issues_table其中customer_table.CustomedId = issues_table.CustomedId;

答案 1 :(得分:0)

使用此查询在生产中运行它。我有数百万条记录,它的工作没有任何麻烦和快速。经过全面测试。

create table new_table as select * from customer_table t1 where t1.CustomedId NOT IN (Select t2.CustomedId FROM issues_table t2);