我想训练一个转换神经网络来检测图像中手的存在。
困难在于: 1 /图像将包含除手之外的其他对象,就像一组人的图片,其中手只是图像的一小部分 2 /手可以有很多方向/形状等(无论它们是否开放,视角度等而定。)
我正在考虑在大量裁剪的手部图像(+无图像的随机图像)上训练预测,然后将分类器应用于我图像的所有子方格。这是一个好方法吗?
我是否可以使用复杂的2级回卷/ RNN的其他例子作为灵感?
谢谢!
答案 0 :(得分:1)
这似乎更多的是找到好的标记训练数据而不是选择网络。神经网络可以学习“手的图片”和“偶然包含手的图片”之间的区别,但它需要一些标记的例子来确定图像属于哪个类别。
答案 1 :(得分:1)
我正想着在一大堆裁剪的手上训练小天使 图像(+无手的随机图像)然后应用分类器 在我的图像的所有子方格上。这是一个好方法吗?
是的,我相信这是一个很好的方法。但是,请注意,当您说随机时,您应该从“手最有可能出现”的图像中对其进行采样。这实际上取决于您的使用案例,您必须调整数据集以适应您正在做的事情。
如何构建数据集,将是这样的:
但是,如果您选择这样做:
之所以这样,是因为已经存在基础分布。我假设您的大多数图像可能是朋友群体的照片,在房子里举行派对,或者背景图像可能是建筑物。因此,引入风景图像可能会破坏这种分布,同时坚持上述假设。
因此,使用“随机图像”时要非常小心!
在我图像的所有子方格上
至于你问题的这一部分,你基本上是在整个图像上运行一个滑动窗口。是的,实际上,它会起作用。但如果你正在寻找表现,这可能不是一个好主意。您可能希望运行一些分段算法,以缩小搜索范围。
我是否还有其他复杂的2级回卷/ RNN示例 用于灵感?
我不确定复杂的2级犯规是什么意思。我不熟悉RNN,所以让我专注于回顾。你基本上可以自己定义卷积网。例如,卷积层大小,层数,最大池化方法是什么,完全连接层的大小等等。最后一层,基本上是一个softmax层,其中net决定了它的类是什么类是。如果您有2个类,则最后一个层有2个节点。如果你有3,那么3.依此类推。所以它的范围可以是2,甚至可能是1000.我没有听说有超过1000个班级的犯规,但我可能不了解情况。我希望这有帮助!