标签: join apache-spark
我正在尝试了解broadcastHashJoin的执行方式。 我知道小表是向所有节点发送广播,但接下来结果会被发送回驱动程序? 我正在使用spark ui来解决网络流量的管理方式,但我没有得到相关的结果,并且驱动程序结果总是为空: 为什么我看不到司机的交通?
答案 0 :(得分:4)
您看到的驱动程序中丢失的数据很可能与is not executed inside job并未创建有用指标的散列部分相对应。