如何从hbase中删除重复数据

时间:2014-05-26 14:21:54

标签: hadoop hbase impala hbasestorage

我有一个hbase表。

表架构:empid,empname,age

数据1:密钥 - 1001值-1,约翰,26(正确数据)

数据2:密钥 - 1002值-1,约翰,25(错误数据。由用户错误输入。)

只有两列具有相同的值empid,empname。我想获取那些具有相同值的记录,除了单列值不同。

注意:3列可能有相同的值,但第4列有不同。

如果你能给我Impala查询会很好。

0 个答案:

没有答案