我正在研究机器学习问题。目的是预测客户是否会签署合同以及签订合同需要花费多少时间。
所以我打算如何处理它: 1-训练第一个模型进行分类预测,以预测阳性模型。 仅针对实际签约客户并预测其响应时间的培训实例的2培训第二回归模型。 3-使用第一个模型,预测正面成绩 4-使用第二个模型,仅根据预测为正的那些预测目标时间。
请您告诉我我的方法是否正确,我会引入任何偏见吗?有没有已知的方法可以解决此类问题。
非常感谢。
答案 0 :(得分:0)
我相信您的方法是正确的,因为没有登录的人没有必要包括登录时间。实际上,如果将他们包括在回归中,您甚至无法为其分配任何有意义的目标值。例如,如果您将零指定为登录时间,则表示他们比实际登录的人更渴望,这是荒谬的。如果为它们分配较大的值,则模型将对它们进行不必要的强调,并且效果会不佳。