标签: cluster-computing distributed-computing apache-spark spark-streaming
假设我们的集群中有20个节点。 Operation1用于计算1s时间窗口中的单词,operation2用于在60s的时间窗口内对从operation1导出的结果进行求和(结果当然是60s时间窗口内的单词计数)。但有没有什么方法可以指定节点1-10来执行operation1和节点11-20来执行operation2?谢谢!