应用错误收集

时间：2017-07-29 10:13:13

标签： python machine-learning deep-learning knn handwriting-recognition

我想使用自定义数据集，其中包含除英语之外的其他语言的手写字符的图像。我打算使用KNN算法对手写字符进行分类。

以下是我目前面临的一些挑战。 1.图像尺寸不同。 - 我们如何解决这个问题，任何使用Python完成的ETL工作？ 2.即使我们假设它们的大小相同，每个图像的潜在像素大约为70 * 70，因为字母比英文复杂，字符之间有许多特征。 - 这对我的训练和表现有何影响？

答案 0 :(得分：1)

无论如何，如果绘制的字母彼此太相似，当然会更难识别它们。

一个有趣的想法不是简单地使用像素作为训练数据，您可以创建一些特殊功能，如下所述：http://archive.ics.uci.edu/ml/datasets/Letter+Recognition