训练图像分类器 - 神经网络

时间:2015-03-29 21:43:56

标签: neural-network deep-learning conv-neural-network

我想训练一个转换神经网络来检测图像中手的存在。

困难在于: 1 /图像将包含除手之外的其他对象,就像一组人的图片,其中手只是图像的一小部分 2 /手可以有很多方向/形状等(无论它们是否开放,视角度等而定。)

我正在考虑在大量裁剪的手部图像(+无图像的随机图像)上训练预测,然后将分类器应用于我图像的所有子方格。这是一个好方法吗?

我是否可以使用复杂的2级回卷/ RNN的其他例子作为灵感?

谢谢!

2 个答案:

答案 0 :(得分:1)

这似乎更多的是找到好的标记训练数据而不是选择网络。神经网络可以学习“手的图片”和“偶然包含手的图片”之间的区别,但它需要一些标记的例子来确定图像属于哪个类别。

您可能需要查看此内容:http://www.socher.org/index.php/Main/ParsingNaturalScenesAndNaturalLanguageWithRecursiveNeuralNetworks

答案 1 :(得分:1)

  

我正想着在一大堆裁剪的手上训练小天使   图像(+无手的随机图像)然后应用分类器   在我的图像的所有子方格上。这是一个好方法吗?

是的,我相信这是一个很好的方法。但是,请注意,当您说随机时,您应该从“手最有可能出现”的图像中对其进行采样。这实际上取决于您的使用案例,您必须调整数据集以适应您正在做的事情。

如何构建数据集,将是这样的:

  1. 从大图像中裁剪手部图像。
  2. 从相同图像中采样X个图像,但不能靠近手/手的任何位置。
  3. 但是,如果您选择这样做:

    1. 从大图像中裁剪手部图像。
    2. 下载100万张绝对没有手的图片(夸张)。例如,沙漠,海洋,天空,洞穴,山脉,基本上有很多风景。然后使用它作为“无手的随机图像”,你可能会得到不好的结果。
    3. 之所以这样,是因为已经存在基础分布。我假设您的大多数图像可能是朋友群体的照片,在房子里举行派对,或者背景图像可能是建筑物。因此,引入风景图像可能会破坏这种分布,同时坚持上述假设。

      因此,使用“随机图像”时要非常小心!

        

      在我图像的所有子方格上

      至于你问题的这一部分,你基本上是在整个图像上运行一个滑动窗口。是的,实际上,它会起作用。但如果你正在寻找表现,这可能不是一个好主意。您可能希望运行一些分段算法,以缩小搜索范围。

        

      我是否还有其他复杂的2级回卷/ RNN示例   用于灵感?

      我不确定复杂的2级犯规是什么意思。我不熟悉RNN,所以让我专注于回顾。你基本上可以自己定义卷积网。例如,卷积层大小,层数,最大池化方法是什么,完全连接层的大小等等。最后一层,基本上是一个softmax层,其中net决定了它的类是什么类是。如果您有2个类,则最后一个层有2个节点。如果你有3,那么3.依此类推。所以它的范围可以是2,甚至可能是1000.我没有听说有超过1000个班级的犯规,但我可能不了解情况。我希望这有帮助!