Spark,从培训/测试循环到模型,一直致力于在生产中取得得分

时间:2019-06-25 08:39:03

标签: python apache-spark machine-learning

假设我们对模型进行了训练/测试,发现模型很好,然后将训练好的模型保存在文件系统中。

所有这些,使用spark和spark ML lib。 (python)

1)我们如何开始在生产中使用此模型来处理实际需求并进行预测?我们是否可以使用相同的Spark集群(我的意思是将模型加载到另一个Spark应用中,并使用该模型处理在线请求)?

2)我们是否应该同时对更现代的数据进行训练/测试,并偶尔“刷新”我们在生产中使用的模型? 那是可以接受的解决方案吗?

3)恐怕python的在线/生产性能可能会很低,那么有没有办法加快生产中的执行速度?我的意思是训练有素的模型,可以将它转移到C还是以其他方式“提高速度”?

谢谢

0 个答案:

没有答案