我想编写一种算法,可以拍摄一部分照片并将它们与同一物体的另一张照片匹配。
例如,如果我给计算机一张花瓶的图片和一个带有花瓶的场景图片,我希望它能确定花瓶在图像中的位置。 我将如何开始开发这样的算法?
此算法的最终用法将是一个应用程序,例如用某人的脸部图片可以判断他们是否在一群人中。该算法最终将应用于视频流。
编辑:我不期待这个问题的实际解决方案,因为我不希望很快解决它。真正的问题是你如何将这样的东西定义为计算机,以便你可以制定算法来实现它。
由于
答案 0 :(得分:2)
我的一位前任老师写了一篇关于类似问题的博士论文,除了他的输入是一个详细的3D模型,他将用它在2D图像中找到该对象。这是一个非常重要的问题,没有单一的“答案”,当然也没有什么能适合Stack Overflow格式。
我的最佳答案:收集大量资金并聘请经验丰富的程序员。
祝你好运。
答案 1 :(得分:1)
简单的答案是,找到一种描述面孔的数学方法,可以解释角度和部分缺失数据,然后改进和教授它。
显然苹果已经做了类似的事情,然而,它仍然会犯错误,并且必须在向前推进时进行教学。
我希望它能更多地关于数学,而不是编程。
答案 2 :(得分:1)
您描述的第一个问题和第二个问题都是完全不同的。
每个主要部分都由numerous机器视觉库解决。您可能需要多种技术组合才能在任一任务中取得任何成功。
在第一个中,你需要一些通常识别物体的东西。可能我会同时使用多种算法来识别模型图像中的前景对象,然后对分割的目标图像进行某种加权比较。
在第二种情况下,检查面部相对于上面的一般识别器来说是一个更加困难的问题。面孔看起来都一样,或者差不多。一般识别者会注意到的事情不太可能有利于区分面孔。您需要一种已经调整为面部识别的算法。幸运的是,这是一个快速成熟的领域,你可以做到这一点和第一种情况,但有一组不同的功能。
答案 3 :(得分:0)
我认为你会发现这是一个非常大的挑战。这是一个极其困难的问题,并且是属于人工智能(AI)领域的许多计算领域之一。面部识别肯定是这个问题最受欢迎的变种,尽管你可能在媒体上看到了什么,但任何声称的成功都不是它们的成就。我认为最接近的解决方案涉及神经网络,它们通常需要非常清晰和精心挑选的图像。
你可以尝试阅读here。祝你好运!