如何在配置单元中编写自联接查询以避免自定义重复项

时间:2013-11-04 15:37:55

标签: hadoop hive hiveql

我需要通过从具有模式Item,value的表匹配的值来获取这对项。我可以通过自我加入实现它,但我得到重复的值,如下所示

Item     Value
---------------
item1    value1
item2    value1
item3    value3
item4    value2

当我使用distinct进行自我加入时,我会得到像

这样的值
Item1    Item2    Value
------------------------
item1    item2    value1
item2    item1    value1

但对我来说,上面的行是重复的,只需要其中一行。我怎样才能做到这一点?感谢您的兴趣和帮助。

注意: 由于我在此要求中有自己的重复定义,我在问题中将其称为custom-duplicates。如果他们被另一个名字打电话,请建议。

1 个答案:

答案 0 :(得分:2)

解决方案很简单 添加where子句:Item1>Item2