我想开发一个模型,该模型可以对客户旅程的二进制性质进行分类(1表示旅程已完成购买,而0表示未进行购买(“ jrn_type”列)。旅程由渠道组成,例如如下图所示(第1列到第7列)。
哪种模型最适合数据?
答案 0 :(得分:4)
朴素贝叶斯是一种简单但有效且常用的机器学习分类器。它是一种概率分类器,它使用贝叶斯设置中的“最大后验”决策规则进行分类。根据您的数据,您最好使用朴素贝叶斯模型。 Logistic回归始终是一个很好的备用数据库,决策树将对您的数据进行分类,但不如朴素贝叶斯分类。 最后,我建议您使用交叉验证方法来验证模型,以确保您已经很好地学习了模型。