假设我们对模型进行了训练/测试,发现模型很好,然后将训练好的模型保存在文件系统中。
所有这些,使用spark和spark ML lib。 (python)
1)我们如何开始在生产中使用此模型来处理实际需求并进行预测?我们是否可以使用相同的Spark集群(我的意思是将模型加载到另一个Spark应用中,并使用该模型处理在线请求)?
2)我们是否应该同时对更现代的数据进行训练/测试,并偶尔“刷新”我们在生产中使用的模型? 那是可以接受的解决方案吗?
3)恐怕python的在线/生产性能可能会很低,那么有没有办法加快生产中的执行速度?我的意思是训练有素的模型,可以将它转移到C还是以其他方式“提高速度”?
谢谢