我在Hive中有一个名为loan_table的表,它按城市划分并按分支存储。假设以班加罗尔为城市(分区),班加罗尔市包含20个分支(存储桶)。
昨天的数据已加载到贷款表中,加载后发现特定分支(例如Koramangla分支)的数据已损坏。今天,我获得了Koramangla分公司的正确数据。
如何在不影响其他分支的情况下更新Kormangla分支的配置单元表。
创建语句:-
hive>创建表bankDeposit(id int,名称字符串,amount int,分支字符串,修改的时间戳记),按(城市字符串)划分,再按(分支)聚类为2个存储为实木复合地板的存储桶;
好
花费时间:1.128秒
蜂巢> desc bankDeposit;
好
id int
名称字符串
整数
分支字符串
城市字符串
昨天的数据:-
1,'Anubeig',10000,'Kormangla','Bangalore'
2,'Muni',20000,'Kormangla','Bangalore'
3,'Murali',30000,'Kormangla','Bangalore'
4,'Sekhar',10000,'MG Road','Bangalore'
5,'Murali',20000,'Sivaji Nagar','Bangalore'
6,'Murali',30000,'MG Road','Bangalore'
我获得了Kormangala分支的有效数据:-
1,'Anubeig Mogal',40000,'Kormangla','Bangalore'
2,'Muni Babu',20000,'Kormangla','Bangalore'
3,'Murali K',30000,'Kormangla','Bangalore'
请帮助我,如何将以上3行更新为现有数据。