应用错误收集

什么是oozie相当于Spark？

时间：2015-11-24 00:55:17

标签： hadoop apache-spark bigdata apache-spark-1.5

我们需要编写和安排非常复杂的管道。我看到Hadoop生态系统有Oozie。当我在Mesos或Standalone上运行Spark并且没有Hadoop集群时，基于Spark的作业有哪些选择？

2 个答案:

答案 0 :(得分：0)

Oozie可用于纱线，对于spark，没有可用的内置调度程序，因此您可以自由选择任何在集群模式下工作的调度程序。

对于Mesos，我觉得Chronos是正确的选择，有关Chronos

的更多信息

答案 1 :(得分：0)

与Hadoop不同，使用Spark链接东西非常容易。因此编写Spark Scala脚本可能就足够了。我的第一个建议就是把它绑起来。

如果你想保持它的SQL，你可以试试SparkSQL。

如果您的流程非常复杂，那么值得查看Google数据流https://github.com/GoogleCloudPlatform/DataflowJavaSDK。