标签: java scala apache-spark
使用案例:我有一个java应用程序(比如说服务器),它包含内存中的一些数据()。从该应用程序,我想使用来自应用程序的数据运行spark ML管道。
我有哪些选择? 我已经考虑使用ML管道和java接口创建一个jar并使用SparkLauncher来运行此管道。但是,我没有看到任何将内存数据廉价转移到jar中的可能性。
由于性能在我的情况下很重要,因此不希望将数据写入文件。
P.S。该管道旨在以本地(或独立)模式运行。