Azure ML-在数据集的各部分上训练模型

时间:2019-05-29 16:20:53

标签: machine-learning azure-machine-learning-studio

我真的可以使用一些帮助!

我工作的公司由52个非常不同的业务组成,因此我无法在公司一级进行预测,而是需要逐个业务地进行预测,然后汇总结果以进行全公司范围的预测。

我在studio.azureml.net中编写了ML模型 它以0.947的确定系数很好地工作,但这是其中一种业务。 我现在需要训练其他51个模型。

有没有一种方法可以在单个ML模型中执行此操作,而不必创建52个非常相似的模型?

任何帮助将不胜感激!

亲切问候 马丁

1 个答案:

答案 0 :(得分:0)

您可以使用Ensembles,将多个模型组合起来以改善预测。当所有模型的输出都在整个数据集中训练时,最直接的方法就是堆叠。 我认为,最适合您的问题的方法是装袋(引导聚合)。您需要将训练集划分为不同的子集(每个子集对应于一个特定的业务),然后在每个子集上训练不同的模型,并合并每个分类器的结果。 另一种方法是增强功能,但是很难在Azure ML中实现。 您可以在Azure ML Gallery中看到一个示例。

书名:

  

可以在Azure Machine中轻松实现堆栈和装袋   学习,但是其他合奏方法更加困难。还有   事实证明,在Azure机器学习中实现   例如,超过五个模型的集合。实验充满了   模块,并且很难维护。有时候值得   使用R或Python中可用的任何集成方法。增加更多   用脚本编写的合奏的模型可能很简单   更改代码中的数字,而不是复制和粘贴模块   进入实验。

您还可以查看sklearn (Python)和插入符号(R)文档以了解更多详细信息。