想象一下,我有一个包含10,000个详细图像(例如照片)的图像数据库,我想在另一个设置中识别它们,例如在墙上框架,或者作为公共汽车站的海报,所以不是确切的图像,但打印出来然后可能有眩光或不同角度和另一个图像。
我可以在不同的设置中制作一个图像的训练集(挂在墙上,在公共汽车站)但是我有太多的图像要为每个图像手动完成。
我可以想到一种方法,我创建一个计算机程序,在不同的位置插入图像,并将其用作训练集(例如,10,000个图像乘以X个位置/设置),但这将是一个非常大的训练集。
如果没有针对每张图片的特定训练集,还有其他方法吗?理想情况下,一旦模型被训练,我可以给它图像10,001,它将在各种设置中识别它。
答案 0 :(得分:0)
这通常通过基于特征的方法(如SIFT,SURF等)来完成。这些方法创建的图像描述符对各种失真非常稳健,不需要培训。
但请注意,对于10K图像,您的里程可能会有所不同 结果取决于看不见的图像的分辨率,每个10K图像中的实际图像特征量以及它们彼此之间的相似程度。