我是AI / ML的新手,我正在尝试使用它来解决以下问题。 我有一组(自定义)图像,虽然具有共同的特征,但也将具有独特的图案/签名和颜色值。我应该使用哪些算法来以下列方式传递: 1.识别共同特征(如在10x10mm图像中的任何位置存在三角形)。如果存在,继续,否则退出。 2.识别独特的图案/签名以单独识别每个图像。图案/签名可以是形状(人眼可见或隐藏,如使用覆盖形状,使用没有边界的背景图像)。 3.存储色调/色调/饱和度以确定任何损失/差异(可能因为捕获源与原始捕获源不同)。
虽然这与面部识别算法类似,但对于我来说,饱和度/阴影在与方向无关时很重要。
我认为使用CNN可能是步骤#2和SVN步骤#1的方法,任何有关培训的输入,细节都将受到赞赏。那么步骤#3,使用BGR2HSV?目标是使用ML / AI而不是进入机器视觉。
答案 0 :(得分:1)
- 识别共同特征(如在10x10mm图像中任何位置都存在三角形)。如果存在,继续,否则退出。
醇>
从某种意义上说,你想要的是一个能够检测图像中图案的分类器。但是,我们可以训练分类器来检测图像中的某些类型的模式。
例如,我可以训练分类器来识别正方形和圆形,但是如果我向它显示一个带有三角形的图像,我不能指望它告诉我它是一个三角形,因为它以前从未见过它。缺点是,您的分类器最终会将其错误分类为知道存在的形状之一:方形或圆形。好处是,你可以防止这种情况。
- 识别独特的图案/签名以分别识别每个图像。
醇>
您要做的是在大量数量的标记数据上训练分类器。如果您希望分类器检测图像中的正方形,圆形或三角形,则必须使用大量标记的正方形,圆形和三角形图像对其进行训练。
- 存储色调/色调/饱和度以确定任何损失/差异(可能因为捕获源与原始捕获源不同)。
醇>
现在,您将离开简单图像标签领域并进入计算机视觉世界。这不像香草图像分类器那么简单,但它是可能的,并且有很多在线工具可以帮助您完成此操作。例如,您可以查看OpenCV。他们在python和C ++中有一个实现。
我认为使用CNN可能是第2步和第2步的方法 步骤#1
您可以将步骤1和步骤2与卷积神经网络(CNN)结合使用。您不需要使用两步预测过程。但是,请注意,如果您将CNN传递给汽车的图像,它仍会将其标记为形状。你可以通过在一百万个正形状样本上训练它,以及一百万个带有“其他”类的随机其他图像的负样本来绕过这个。这样,任何不是形状的东西都会被归类为“其他”。这是一种可能性。
步骤#3怎么样,使用BGR2HSV?目标是使用ML / AI而不是 进入机器视觉。
通过包含此步骤,除了进入计算机视觉之外别无选择。我不确定如何解决这个问题,但我可以保证OpenCV会为您提供一种方法。事实上,使用OpenCV,您将不再需要实现自己的CNN,因为OpenCV有自己的图像标记库。