TensorFlow使用初始v3模型来识别对象。我想知道,如果有任何方法可以在较大的图像中找到较小的图像。例如,将所有橙子放在橙树上。我尝试将较大的图像分割成较小图像的网格,并在每个较小的图像上应用张量流,但是具有恒定的网格非常容易出错,是否有任何解决方案?
答案 0 :(得分:1)
您正在寻找的术语是对象检测。您可以使用不同比例的滑动窗口。这是一种方式,那里可能更好,但我不知道它们是什么。
让我们说一些橙子比其他橙子更接近。从左上角的10x10(或其他)框开始,查看您的模型是否将其分类为橙色。将您的框移动到右侧2个像素(或某物)。再试一次。继续向右移动,然后向下移动2个像素并开始新的行等。现在将图像调整为更小(现在您正在寻找更大的橙色),并重复整个过程。您可以谷歌搜索“滑动窗口检测”和“图像金字塔”等内容,以了解更多信息。
一旦你完成了你的图像,你将会有一堆检测 - 你必须找到一些方法来对你的检测执行非最大限制,因为你可能有太多了。