我是新手。我需要知道它是否可以在hive中连接两个表(比如基于CustomedId列的customer_table和issues_table)并使用insert overwrite在hive中的新表中插入值?
答案 0 :(得分:1)
是的,可以使用CTAS(create table new_table as select ...
)语法。
将table new_table创建为select * from customer_table,issues_table其中customer_table.CustomedId = issues_table.CustomedId;
答案 1 :(得分:0)
使用此查询在生产中运行它。我有数百万条记录,它的工作没有任何麻烦和快速。经过全面测试。
create table new_table as select * from customer_table t1 where t1.CustomedId NOT IN (Select t2.CustomedId FROM issues_table t2);