我对项目有以下规范:
给定一个大约2000个二进制图像的数据集(我们称之为test dataset
),其中每个图像对应一个字形,我想在不同的数据集上找到每个测试图像的最佳匹配(让我们称之为reference dataset
)有大约6000个独特的字形。
以下是字形的一些示例:
因此,对于test dataset
中的每张图片,我想在reference dataset
中找到最佳匹配。
两组图像的尺寸略有不同,但这只是填充问题。 test dataset
中包含的所有图像字形也位于reference dataset
。
我的第一个想法是在TensorFlow中使用CNN,但是,鉴于我有大量的类(大约6000),存在大的内存问题。此外,鉴于两个数据集上的字形非常相似,使用CNN有点过分。
那么在不使用神经网络的情况下,在Python中解决这个问题最直接的方法是什么?
答案 0 :(得分:1)
只是在头脑中。 1.为测试和参考图像生成功能。尝试使用让我们说SIFT功能。 2.您现在可以聚类聚类图像,因为您将拥有图像的矢量表示。尝试使用k均值与余弦距离 3.现在给测试图像聚类测试图像并找到它所属的聚类。将测试图像与群集中的图像进行比较。
如果不清楚,请告诉我。