标签: image-processing neural-network computer-vision conv-neural-network
大多数检测问题的方法或多或少都基于某种形式的边界框提议,后者转向两类(正/负)分类。我在这些主题上找到了很多材料。
但是我想知道,是不是有一些方法将整个图像作为输入,然后通过几个卷积和池化层发送它,其输出将是两个数字(x, y位置宾语)?当然,这意味着图像中只有一个对象。到目前为止,我还没有发现任何相关信息,我认为它不可用吗?
x, y