我真的可以使用一些帮助!
我工作的公司由52个非常不同的业务组成,因此我无法在公司一级进行预测,而是需要逐个业务地进行预测,然后汇总结果以进行全公司范围的预测。
我在studio.azureml.net中编写了ML模型 它以0.947的确定系数很好地工作,但这是其中一种业务。 我现在需要训练其他51个模型。
有没有一种方法可以在单个ML模型中执行此操作,而不必创建52个非常相似的模型?
任何帮助将不胜感激!
亲切问候 马丁
答案 0 :(得分:0)
您可以使用Ensembles,将多个模型组合起来以改善预测。当所有模型的输出都在整个数据集中训练时,最直接的方法就是堆叠。 我认为,最适合您的问题的方法是装袋(引导聚合)。您需要将训练集划分为不同的子集(每个子集对应于一个特定的业务),然后在每个子集上训练不同的模型,并合并每个分类器的结果。 另一种方法是增强功能,但是很难在Azure ML中实现。 您可以在Azure ML Gallery中看到一个示例。
书名:
可以在Azure Machine中轻松实现堆栈和装袋 学习,但是其他合奏方法更加困难。还有 事实证明,在Azure机器学习中实现 例如,超过五个模型的集合。实验充满了 模块,并且很难维护。有时候值得 使用R或Python中可用的任何集成方法。增加更多 用脚本编写的合奏的模型可能很简单 更改代码中的数字,而不是复制和粘贴模块 进入实验。
您还可以查看sklearn (Python)和插入符号(R)文档以了解更多详细信息。