我是雷的新手。我在同一Linux机器上的6个辅助节点的小型头节点上。当我向它提交非常小的程序时,它就起作用了。但是,一旦我提交了一些大程序,所有的ray工作者就会崩溃。
我在https://docs.ray.io/en/ray-0.4.0/internals-overview.html上阅读了
“一旦将任务调度到本地调度程序(无论是通过自身调度程序还是通过全局调度程序调度),本地调度程序都会将任务排队等待执行。当有足够的资源可用并且对象依赖项在本地可用时,会将任务分配给工作程序,按照先进先出的顺序。
“