如何将记录追加到现有的分区Hive表中? 例如,我有一个名为“ip_country”的外部表,数据集是testdata1。如果数据集增长,比如说我的数据集在第二天就是testdata1和testdata2,那么如何将新数据,即“testdata2”附加到“ip_country”hive表。
答案 0 :(得分:3)
可以通过几种方式实现(完全取决于您的要求)
INSERT OVERWRITE TABLE tablename1 [PARTITION(partcol1 = val1, partcol2 = val2 ...)[IF NOT EXISTS]] select_statement1 FROM from_statement;
INSERT INTO TABLE tablename1 [PARTITION(partcol1 = val1,partcol2 = val2 ...)] select_statement1 FROM from_statement;