IBM Watson Visual识别。是否可以从特定对象获取X,Y坐标?

时间:2017-08-02 18:28:30

标签: api ibm-watson visual-recognition

我从一个大学项目开始,我正在寻找一个工具,帮助我找到图像中特定对象的坐标(X,Y)(我不是在谈论文本)。我想知道IBM Watson Visual识别能否帮助我实现这一目标,或者您是否知道任何其他可以更好地工作的工具。

谢谢。

2 个答案:

答案 0 :(得分:1)

你可以"那种"使用Watson视觉识别来做到这一点。首先,您需要训练自定义分类器以找到"找到"你正在寻找的对象。一旦你完成了这件事,你就完成了一半。

第二部分涉及拍摄想要找到物体的图像,并将其分成四个部分(左上,左下,右上,右下)。然后搜索图像的每个部分以查找目标对象。如果您在其中一个象限中找到它,则可以取出该象限并将其分成四个部分,然后在图像的每个部分中搜索目标对象。如果你继续并递归地执行此操作(并跟踪每个象限和子象限的像素边界),最终你将缩小你正在搜索的对象。

现在您还应该尝试其他搜索算法。考虑目标对象位于图像中心的情况 - 它不会出现在任何象限中。如果您的对象恰好跨越象限边界,您将无法获得准确的位置,因此需要多种搜索模式,但策略和方法是相同的。

答案 1 :(得分:1)

你也可以采取混合"云边缘"方法,如下所述:https://medium.com/unsupervised-coding/dont-miss-your-target-object-detection-with-tensorflow-and-watson-488e24226ef3

它使用本地运行的TensorFlow模型来检测区域,然后使用Watson VR来说明每个区域中的内容。这结合了TensorFlow的灵活性和Watson VR对许多(数万种)不同类型对象进行分类的能力。