使用aztk集群提交执行spark任务时,只有驱动程序节点正在执行任务。如果我使用aztk spark cluster get检查集群状态,则只有主服务器正在运行,而其他主机则处于空闲状态。
此外,通过使用ssh并查看spark Web UI,所有工作进程都是可见的,而在任务运行时所有工作进程均未使用。即使查看事件图,它也表明任务没有被拆分,并且查看完成任务所花费的时间,集群中的3个节点和5个节点之间没有差异。
发生这种情况是否有任何原因。作为数据存储,我正在从wasb Azure存储中检索数据。