我想使用自定义数据集,其中包含除英语之外的其他语言的手写字符的图像。我打算使用KNN算法对手写字符进行分类。
以下是我目前面临的一些挑战。 1.图像尺寸不同。 - 我们如何解决这个问题,任何使用Python完成的ETL工作? 2.即使我们假设它们的大小相同,每个图像的潜在像素大约为70 * 70,因为字母比英文复杂,字符之间有许多特征。 - 这对我的训练和表现有何影响?
答案 0 :(得分:1)
选择一定尺寸并调整所有图像的大小(例如使用PIL模块);
我认为这取决于数据的质量和语言本身。如果字母很复杂(如象形文字),那将很难。如果字母是用细线绘制的,那么即使在小图片中也可以识别它们。
无论如何,如果绘制的字母彼此太相似,当然会更难识别它们。
一个有趣的想法不是简单地使用像素作为训练数据,您可以创建一些特殊功能,如下所述:http://archive.ics.uci.edu/ml/datasets/Letter+Recognition