Python上的字形匹配

时间:2017-04-16 17:11:29

标签: python image-processing ocr

我对项目有以下规范:

给定一个大约2000个二进制图像的数据集(我们称之为test dataset),其中每个图像对应一个字形,我想在不同的数据集上找到每个测试图像的最佳匹配(让我们称之为reference dataset)有大约6000个独特的字形。

以下是字形的一些示例:

enter image description here

enter image description here

enter image description here

因此,对于test dataset中的每张图片,我想在reference dataset中找到最佳匹配。

两组图像的尺寸略有不同,但这只是填充问题。 test dataset中包含的所有图像字形也位于reference dataset

我的第一个想法是在TensorFlow中使用CNN,但是,鉴于我有大量的类(大约6000),存在大的内存问题。此外,鉴于两个数据集上的字形非常相似,使用CNN有点过分。

那么在不使用神经网络的情况下,在Python中解决这个问题最直接的方法是什么?

1 个答案:

答案 0 :(得分:1)

只是在头脑中。 1.为测试和参考图像生成功能。尝试使用让我们说SIFT功能。 2.您现在可以聚类聚类图像,因为您将拥有图像的矢量表示。尝试使用k均值与余弦距离 3.现在给测试图像聚类测试图像并找到它所属的聚类。将测试图像与群集中的图像进行比较。

如果不清楚,请告诉我。