应用错误收集

时间：2015-03-21 13:54:44

标签： matlab image-processing k-means predict handwriting-recognition

我做手写字符识别执行后我输出This

我的目标是预测输出图像文件的字符，例如test，我使用了这个k-means File

任何人请帮我预测输出图像的特征。这将有助于我提前感谢我的项目中的进一步步骤。

答案 0 :(得分：1)

执行OCR需要相当大的现有字母训练集，以便k-means进行操作。对于该应用使用k均值将涉及对图像本身进行聚类（单个图像将是单个数据点），而不仅仅是对给定图像的像素进行聚类。一个好的起点可能是数字识别的MNIST dataset。

此外，k-means是一种无监督学习算法，可能无法为OCR提供很好的结果。它创建的类可能会将类似a和o之类的字母混合在一起，为不同的sytles中写入的同一个字母创建多个类，并完全忽略其他字母。

您应该考虑使用监督算法，其中训练数据被标记，如k-最近邻居。通过这种方式，您可以提前了解课程，并在测试阶段取得更好的成功。