从应用程序运行spark

时间:2018-02-06 13:06:58

标签: java scala apache-spark

使用案例:我有一个java应用程序(比如说服务器),它包含内存中的一些数据()。从该应用程序,我想使用来自应用程序的数据运行spark ML管道。

我有哪些选择? 我已经考虑使用ML管道和java接口创建一个jar并使用SparkLauncher来运行此管道。但是,我没有看到任何将内存数据廉价转移到jar中的可能性。

由于性能在我的情况下很重要,因此不希望将数据写入文件。

P.S。该管道旨在以本地(或独立)模式运行。

0 个答案:

没有答案