如果图像相同,CNN能否识别出大小差异?

时间:2019-10-21 19:27:59

标签: image size conv-neural-network convolution

CNN能否分辨出同一生物的不同大小范围之间的差异?像小狗对成年人还是孩子对成年人?还是更像是大苍蝇还是小苍蝇,它们看上去一样,但一个比另一个大?

2 个答案:

答案 0 :(得分:0)

这是一个棘手的问题,但通常理论上的CNN可以解决。它主要取决于训练数据本身。如果是儿童vs成人,则可以收集一个数据集,其中包括很多大小和年龄的差异,以确保您拥有的CNN模型能够在最后找到模式并进行概括。最后,CNN将学习许多使分类比例或大小不变(取决于大小)的特征,例如形状,颜色,衣服和面部特征等。这种类内分类问题,用传统的监督学习很难解决,因此一些研究人员正在采用一种称为“ Deep Metric Learning”的方法。

  

度量学习是学习对象上的距离函数的任务。度量或距离函数必须服从四个公理:非负性,不可识别性,对称性和次可加性(或三角形不等式)。在实践中,度量学习算法会忽略不可区分的身份条件,并学习伪度量。Wiki Definition

Example for Metric Learning

答案 1 :(得分:0)

最好区分您在问题中提到的指标。首先,识别年龄和大小是另一项任务。

关于年龄,是的,这是可行的。对于基于深度学习的方法,您将需要适当的数据。对于非训练方法(老式图像处理),您需要根据年龄为每个对象创建一些指标(计算人类的皱纹,白发等)

不幸的是,关于大小,尚在研究中,尚不清楚它是否适当可行。每当我们提到从单个图像识别对象尺寸时,就需要考虑更多事项。首先是视角。如果在图像中找到的对象相对于图像坐标而言较大,即使它的大小很小,它是否也靠近照相机,因此,它显示的大小还是很大,或者离照相机太远了?可以通过事先了解对象的几何形状以及开发基于该几何形状的算法以及深度学习来克服此类问题。但是,当前的深度学习技术不够准确,无法区分尺寸和位置,因此无法精确区分对象的几何形状。 另一种选择是控制环境。例如,如果您知道两个对象都位于现实世界中的同一平面上(即在桌子上,彼此相邻),那么剩下的就是要解决的琐碎问题。