如何更新配置单元表中的特定存储桶损坏的数据?

时间:2019-07-14 01:05:31

标签: hive bigdata

我在Hive中有一个名为loan_table的表,它按城市划分并按分支存储。假设以班加罗尔为城市(分区),班加罗尔市包含20个分支(存储桶)。

昨天的数据已加载到贷款表中,加载后发现特定分支(例如Koramangla分支)的数据已损坏。今天,我获得了Koramangla分公司的正确数据。

如何在不影响其他分支的情况下更新Kormangla分支的配置单元表。

创建语句:-

hive>创建表bankDeposit(id int,名称字符串,amount int,分支字符串,修改的时间戳记),按(城市字符串)划分,再按(分支)聚类为2个存储为实木复合地板的存储桶; 好 花费时间:1.128秒

蜂巢> desc bankDeposit; 好 id int 名称字符串 整数 分支字符串 城市字符串

昨天的数据:-
1,'Anubeig',10000,'Kormangla','Bangalore'
2,'Muni',20000,'Kormangla','Bangalore'
3,'Murali',30000,'Kormangla','Bangalore'
4,'Sekhar',10000,'MG Road','Bangalore'
5,'Murali',20000,'Sivaji Nagar','Bangalore'
6,'Murali',30000,'MG Road','Bangalore'

我获得了Kormangala分支的有效数据:-
1,'Anubeig Mogal',40000,'Kormangla','Bangalore'
2,'Muni Babu',20000,'Kormangla','Bangalore'
3,'Murali K',30000,'Kormangla','Bangalore'

请帮助我,如何将以上3行更新为现有数据。

0 个答案:

没有答案