应用错误收集

支持向量机（SVM）的经典风格是二元分类器（即，它解决了涉及两个类的分类问题）。但是，它也可以通过应用One vs. One，One Versus All或Error Correcting Output Codes [Alwein et al.]等技术来解决多类别分类问题。最近，对经典SVM的新修改，多类SVM允许直接解决多类分类问题[Crammer et al.]。

现在，就文档分类而言，您的主要问题是特征提取（即如何从文档中获取某些分类功能）。这不是一项微不足道的任务，并且有关于该主题的一批参考书目（例如，[Rehman et al.]，[Lewis]）。

一旦克服了特征提取的障碍，并将文档样本标记并放置在特征空间中，就可以应用任何分类算法，如SVM，AdaBoost e.t.c。

机器学习入门书籍： [Flach]，[Mohri]，[Alpaydin]，[Bishop]，[Hastie]

特定于SVM的书籍： [Schlkopf]，[Cristianini]

关于文档分类和SVM的一些特定参考书目： [Miner et al.]，[Srivastava et al.]，[Weiss et al.]，[Pilászy]，[Joachims]，[Joachims01]，[Joachims97]，[Sassano]

用于文本分类的SVM - 机器学习教程？我该如何开始？

1 个答案: