为什么HDFS / Impala中有远程读取?

时间:2018-08-08 13:15:38

标签: hdfs impala

我想知道如果我在分布在多个节点上的Impala中执行联接查询,是否会在HDFS中进行远程读取。为什么每个节点在发送给下一个运算符之前不只是读取其本地数据?我能想到的唯一原因是当一个节点完成本地读取(或没有本地块)时,它“帮助”读取了更多(远程)数据。有人可以用几个简单的字眼向我澄清一下吗?

让我们简单地以以下联接查询为例: enter image description here

0 个答案:

没有答案