Impala查询结果中的数值更改

时间:2017-02-14 20:48:21

标签: hadoop cloudera-cdh impala

我们有一个包含〜10亿行的Impala表和一个Double类型的值列。当我们运行相同的'选择{dimension}时,来自表格组的总和(值){dimension}'在同一个表上连续多次查询,每次都会得到略微不同的总和。当我们对舍入值求和时也会发生这种情况造成这种变化的原因是什么?有什么方法可以解决这个问题吗?

1 个答案:

答案 0 :(得分:2)

因为Impala查询的执行是分布式的,所以某些计算发生的顺序可能因网络可变性或其他进程而有所不同,并且由于浮点运算不是关联的 [1],这可能导致你所看到的行为。这正是DECIMAL datatype存在的原因。