不一致的Hive Left Join Results

时间:2017-05-02 17:24:46

标签: sql hadoop hive hiveql impala

我编写了一个简单的左边连接hiveql select * from a left outer join b on (a.f1=b.f1 and a.f2=b.f2) 上述查询结果的总计数为798,608。 但是,表a中的记录总数为780,499,但不匹配。

我试图查找仅存在于左连接结果中但不存在于表a中的所有记录;结果空白。

我甚至试图用一些记录创建2个小表(a'和b'),并且左连接结果的计数与表a'记录的计数匹配,如预期的那样。

什么可能导致不一致的结果?

1 个答案:

答案 0 :(得分:0)

感谢David Lee。表b中有1到多种情况。 问题解决了。