机器学习模型概括

时间:2019-05-27 19:20:22

标签: machine-learning model knime

我是机器学习的新手,我想就模型概括提出一个问题。就我而言,我将生产一些机械零件,并且我对控制输入参数以在最终零件上获得某些特性感兴趣。

更具体地说,我对8个参数(例如P1,P2,...,P8)感兴趣。为了优化所需零件的数量以最大化所探索的参数组合,我将问题分为两组。对于第一组作品,我将更改前四个参数(P1 ... P4),而其他参数将保持不变。在第二种情况下,我将做相反的操作(变量P5 ... P8和常量P1 ... P4)。

因此,我想知道是否有可能制作一个具有八个参数作为输入的模型来预测最终零件的特性。我问是因为我没有一次改变所有8个变量,所以我认为也许我必须为每组参数做一个模型,而这2个不同模型的预测不可能相互关联

谢谢。

1 个答案:

答案 0 :(得分:1)

在大多数情况下,拥有两个不同的模型将具有比一个大型模型更高的准确性。原因是在局部模型中,该模型仅查看4个特征,并且能够识别其中的模式以进行预测。

但是这种特定方法肯定会无法扩展。现在,您只有两组数据,但是如果数据增加并且您有20组数据该怎么办。您将无法在生产中创建和维护20个ML模型。

哪种方法最适合您的情况需要进行一些试验。从数据中随机抽取样本并训练ML模型。选取一个大模型和两个局部模型并评估其性能。不仅准确性,还有他们的F1得分,AUC-PR和ROC曲线也可以找出最适合您的方法。如果您没有看到性能大幅下降,那么针对整个数据集的一个大型模型将是一个更好的选择。如果您知道您的数据将始终分为两组,并且您不关心可伸缩性,则可以使用两个本地模型。