我在为数据挖掘任务选择正确的分类器方面遇到了问题。
我使用统计方法标记网页,并使用1-4比例标记它们,1表示最差,4表示最佳。
以前,我使用SVM来训练系统,因为我当时使用二进制(1,0)标签。但是现在因为我切换到这个4级标签,我需要更改分类器,因为我认为SVM分类器只适用于两级分类(如果我错了,请纠正我。)
那么请你在这里提出一些建议,说明我的分类目的最适合哪种分类器。
提前感谢您的建议。
答案 0 :(得分:6)
存在多类SVM。 LibSVM有一个实现,Weka也是如此。
通常最好尝试使用多个分类器来找出哪种分类器最适合您的数据。分类器类型和训练算法的选择远不如您选择的功能集重要。您可以尝试天真的贝叶斯,多类SVM,MaxEnt,投票感知器,或者您的图书馆提供的任何内容。
答案 1 :(得分:2)
您在谈论“序数分类”。它可以使用using SVM,甚至是logistic regression或人工神经网络来修改using decision trees(如前所述,它也在libSVM中实现)。
您甚至可以继续标记,对您的选择进行回归分析,然后对输出进行去除。我上面提到的大部分方法都是在幕后进行的。
祝你好运答案 2 :(得分:1)
您可能会尝试检查Andrew NG Lecture,了解如何选择最适合您的ML算法,我认为这很有启发性,它可能会让您对如何管理数据有所了解