如何在matlab中训练SVM进行字符识别?

时间:2012-04-11 04:21:59

标签: matlab ocr svm

我是我的主要项目的最后一年学生。我的项目基本上是从自然场景中提取文本,然后识别它然后在记事本等中显示它们。

我已经从图像中提取了文本,并且还为每个提取的字符获得了85个特征。

然而,对于识别部分,我不知道如何在matlab中训练或使用SVM(支持向量机),所以我可以得到一个匹配。

请帮助我,因为这变得非常困难

1 个答案:

答案 0 :(得分:9)

如果您对使用现有的SVM实施感到满意,那么您应该使用生物信息学工具箱svmtrain,或者下载libsvm的Matlab版本。如果您想自己实现SVM,那么您应该了解SVM theory,并且可以使用quadprog来解决相应的优化问题。

使用您的数据,您需要具有N-by-85特征矩阵,其中N是多个字符,以及您手动提供的N-by-1“真实标签”数组。根据您用于训练SVM的工具,svmtrain的参数略有不同 - 请查看文档。

如果您想评估SVM以证明其有效,您可能需要整理数据,以便估算分类器的泛化错误 - 请参阅cross-validation