Hive结果与MySql结果不同。加入Hive查询返回意外结果或OK结果

时间:2016-09-07 16:21:03

标签: mysql hadoop hive

我在mysql上有一个连接查询(加入4个表),返回2行,而在Hive上返回OK结果。所以我在hive和mysql方面单独检查了表。

两侧匹配的每个表上的记录,但JOIN查询的结果不同。其他JOIN查询不是这种情况。

我已经检查了所有表格看起来很好的目录。

如果表中没有记录或没有可用于表的目录,则会显示OK结果。但事实并非如此。

蜂巢上的OK结果是否存在问题。

以下是结果的一部分:

Stage-Stage-6: Map: 2  Reduce: 1   Cumulative CPU: 22.22 sec   MAPRFS Read: 0 MAPRFS Write: 0 SUCCESS
Stage-Stage-7: Map: 2  Reduce: 1   Cumulative CPU: 24.94 sec   MAPRFS Read: 0 MAPRFS Write: 0 SUCCESS
Stage-Stage-8: Map: 2  Reduce: 1   Cumulative CPU: 22.25 sec   MAPRFS Read: 0 MAPRFS Write: 0 SUCCESS
Total MapReduce CPU Time Spent: 2 minutes 36 seconds 110 msec
OK
Time taken: 411.225 seconds
hive>

1 个答案:

答案 0 :(得分:0)

根据报告的行为,我们可以推断出在MySQL上实现的内容与在Apache Hive上实现的内容之间存在差异

至于差异是否是由于JOIN行为的差异造成的,这里没有足够的信息来确定针对MySQL的查询和针对Hive的查询将返回不同结果的原因。