Apache Hive:将数据从现有表传输到另一个表

时间:2015-07-13 21:43:20

标签: hadoop apache-hive

我在hdfs中存储了多个现有表。我想从现有的外部表创建新表,以便我可以对数据进行存储,排序和压缩。

从现有表创建表的正确方法是什么?我可以将现有表导出为CSV,然后创建一个新表并导入它,但似乎应该有一种直接从现有表导入数据的方法,但我没有在文档中找到任何内容或通过谷歌找到。< / p>

1 个答案:

答案 0 :(得分:1)

对于一些名为source的现有表和一个名为target的新创建的表,其中包含字段:a,b,c,d

从源读取所有条目并写入目标:

insert overwrite table target select distinct a,b,c,d from source;

这适用于内部和外部表格。