我在机器学习中学到了几个分类器 - 决策树,神经网络,SVM,贝叶斯分类器,K-NN等等。
任何人都可以帮助理解何时我应该更喜欢分类器而不是其他分类器 - 例如 - 在哪种情况下(数据集的性质等)我应该更喜欢决策树而不是神经网络或哪种情况SVM可能比贝叶斯?
很抱歉,如果这不是发布此问题的好地方。
感谢。
答案 0 :(得分:2)
这与数据集的性质极为相关。有几种元学习方法可以告诉你使用哪种分类器,但通常没有黄金法则。
如果您的数据很容易分离(很容易区分不同类的条目),那么决策树或SVM(带有线性内核)就足够了。但是,如果您的数据需要转换为其他[更高]维度空间,则基于内核的分类器可能会运行良好,例如RBF SVM。 SVM还可以更好地处理非冗余的独立功能。当需要特征之间的组合时,人工神经网络和贝叶斯分类器也能很好地工作。
然而,这是非常主观的,并且在很大程度上取决于您的功能集。例如,具有与类高度相关的单个特征可能确定哪个分类器最佳。也就是说,总的来说,无免费午餐定理说没有分类器对所有东西都更好,但SVM通常被认为是目前二进制分类的最佳选择。