请帮我选择合适的分类器

时间:2010-10-10 20:48:51

标签: artificial-intelligence machine-learning data-mining classification

我在为数据挖掘任务选择正确的分类器方面遇到了问题。

我使用统计方法标记网页,并使用1-4比例标记它们,1表示最差,4表示最佳。

以前,我使用SVM来训练系统,因为我当时使用二进制(1,0)标签。但是现在因为我切换到这个4级标签,我需要更改分类器,因为我认为SVM分类器只适用于两级分类(如果我错了,请纠正我。)

那么请你在这里提出一些建议,说明我的分类目的最适合哪种分类器。

提前感谢您的建议。

3 个答案:

答案 0 :(得分:6)

存在多类SVM。 LibSVM有一个实现,Weka也是如此。

通常最好尝试使用多个分类器来找出哪种分类器最适合您的数据。分类器类型和训练算法的选择不如您选择的功能集重要。您可以尝试天真的贝叶斯,多类SVM,MaxEnt,投票感知器,或者您的图书馆提供的任何内容。

答案 1 :(得分:2)

您在谈论“序数分类”。它可以使用using SVM,甚至是logistic regression或人工神经网络来修改using decision trees(如前所述,它也在libSVM中实现)。

您甚至可以继续标记,对您的选择进行回归分析,然后对输出进行去除。我上面提到的大部分方法都是在幕后进行的。

祝你好运

答案 2 :(得分:1)

您可能会尝试检查Andrew NG Lecture,了解如何选择最适合您的ML算法,我认为这很有启发性,它可能会让您对如何管理数据有所了解