如何通过机器学习检测哪些数据影响功能的结果?

时间:2018-03-05 08:21:27

标签: algorithm machine-learning

首先,我将说明我有一个像;

这样的数据集的场景

ProductID,ProductType,MachineID,MachineModel,MachineSpeed,RejectDate,RejectVolume等。

我想找出哪个字段是我的RejectVolume增加的原因?此外,在该方案中,所有产品都具有RejectVolume。我的意思是RejectVolume非零,并且有连续但不同的值。多亏了这一点,我可以认识到原因并找到降低RejectVolume值的解决方案。

你能给我任何关于创建模型的想法吗? 谢谢。

1 个答案:

答案 0 :(得分:2)

您想查看Feature Selection methods

在这种情况下,您可以使用Linear Regression开始Lasso进行功能选择。这是通过连续增加套索正则化项来完成的,这将减少不重要特征的权重,使您具有影响最大的特征。