将经过培训的机器倾斜模型部署到生产中的步骤

时间:2017-04-03 16:55:48

标签: apache-spark machine-learning

我是ML世界的新手,在阅读有关培训数据的建筑模型并最终测试数据以满足要求时,直到这一点我能够遵循,我的问题一旦被测试模型已经准备好了

  1. 生产部署后是否需要培训/重新培训模型?如果是这样的做法是什么?
  2. 是否有办法坚持假设,以便模型能够预测使用的结果?
  3. 每天或每周或每月重新培训模型是否良好做法?
  4. 假设使用spark MLib来构建模型

    • 让我添加更多细节。当我训练模型时,它会在预生产环境中生成基于分数的训练数据,我可以在分布式存储中保存数据以供以后预测,而不是重新训练模型。我想了解步骤 1)当我将经过良好测试的模型从预生产环境运行到生产环境时,是否需要有我想预测结果的培训数据和新数据集?

    我是机器学习的新手,想了解模型代码如何发布到下一个环境,我需要考虑哪些步骤

    感谢您的澄清,这意味着我需要将模型对象部署到生产中,然后使用生产数据(功能)来计算目标数据值?,请您参考我可以深入了解如何构建的任何书籍或信息,验证和部署监督算法。

    再次,谢谢你有时间教育我。

1 个答案:

答案 0 :(得分:1)

生产部署后是否需要培训/重新培训模型?如果是这样的话是什么?

  

不一定,但你可能会。很大程度上取决于现在的情况   建模并且随着时间的推移它是多么稳定。

是否有办法坚持假设,以便模型可以预测使用的结果?

  
      
  • ?我不确定我是否理解这个问题,但大多数生产模型都将记录系统附加到分析/报告/视觉化   软件,以帮助跟踪模型性能,并帮助决定何时   重新训练。
  •   

每天或每周或每月重新训练模型是否是一种好习惯?

  
      
  • 取决于性能和资源限制。如果您有少量模型可以重新训练/得分和重新训练   不会影响SLA,它可能不是一个坏主意,但有时   有限的计算资源答案可能会改变。
  •