Hive转储并重新加载

时间:2013-07-03 10:48:27

标签: hadoop hive

有没有办法制作Hive表转储,以便可以发送表转储并重新加载到Hive中,保留分区,分支结构?

2 个答案:

答案 0 :(得分:1)

Hive 0.8(及更高版本)为我们提供了EXPORT的便利。使用此功能,我们可以将表中的数据与相应的元数据一起导出到HDFS文件。数据以json格式存储。以这种方式导出的数据可以使用IMPORT命令导回到另一个数据库或配置单元实例。

有关详细信息,请参阅this

答案 1 :(得分:0)

基本上你做了一件事就是将文件(dump)加载到hive表(比如说A)并将其视为转储。现在,当将该文件重新加载到其他Hive表(比如说B)时,您实际上可以根据之前的Hive表创建B,即A.要创建类似于A的B,您可以使用org.apache.hadoop.hive.metastore.HiveMetastoreClient类来访问表A的Metastore信息。然后,您可以加载文件(转储)并加载到所需的分区。