我做手写字符识别 执行后我输出This
我的目标是预测输出图像文件的字符,例如test,我使用了这个k-means File
任何人请帮我预测输出图像的特征。这将有助于我提前感谢我的项目中的进一步步骤。
答案 0 :(得分:1)
执行OCR需要相当大的现有字母训练集,以便k-means进行操作。对于该应用使用k均值将涉及对图像本身进行聚类(单个图像将是单个数据点),而不仅仅是对给定图像的像素进行聚类。一个好的起点可能是数字识别的MNIST dataset。
此外,k-means是一种无监督学习算法,可能无法为OCR提供很好的结果。它创建的类可能会将类似a
和o
之类的字母混合在一起,为不同的sytles中写入的同一个字母创建多个类,并完全忽略其他字母。
您应该考虑使用监督算法,其中训练数据被标记,如k-最近邻居。通过这种方式,您可以提前了解课程,并在测试阶段取得更好的成功。