标签: apache-spark machine-learning bigdata
具体来说,我需要一个支持我的模型的开源平台来运行TB级数据
我正在探索不同的开源平台来支持我的自定义ML模型,该模型只需要输入就可以输出。
我遇到了Spark的rdd.pipe(my_model)。但是看起来这不适合使用调度选项来构建管道。
my_model
在任何开源工具/技术中寻找建议