标签: hdfs impala
我想知道如果我在分布在多个节点上的Impala中执行联接查询,是否会在HDFS中进行远程读取。为什么每个节点在发送给下一个运算符之前不只是读取其本地数据?我能想到的唯一原因是当一个节点完成本地读取(或没有本地块)时,它“帮助”读取了更多(远程)数据。有人可以用几个简单的字眼向我澄清一下吗?
让我们简单地以以下联接查询为例: