应用错误收集

这似乎更多的是找到好的标记训练数据而不是选择网络。神经网络可以学习“手的图片”和“偶然包含手的图片”之间的区别，但它需要一些标记的例子来确定图像属于哪个类别。

您可能需要查看此内容：http://www.socher.org/index.php/Main/ParsingNaturalScenesAndNaturalLanguageWithRecursiveNeuralNetworks

我正想着在一大堆裁剪的手上训练小天使图像（+无手的随机图像）然后应用分类器在我的图像的所有子方格上。这是一个好方法吗？

是的，我相信这是一个很好的方法。但是，请注意，当您说随机时，您应该从“手最有可能出现”的图像中对其进行采样。这实际上取决于您的使用案例，您必须调整数据集以适应您正在做的事情。

如何构建数据集，将是这样的：

从大图像中裁剪手部图像。
从相同图像中采样X个图像，但不能靠近手/手的任何位置。

但是，如果您选择这样做：

从大图像中裁剪手部图像。
下载100万张绝对没有手的图片（夸张）。例如，沙漠，海洋，天空，洞穴，山脉，基本上有很多风景。然后使用它作为“无手的随机图像”，你可能会得到不好的结果。

之所以这样，是因为已经存在基础分布。我假设您的大多数图像可能是朋友群体的照片，在房子里举行派对，或者背景图像可能是建筑物。因此，引入风景图像可能会破坏这种分布，同时坚持上述假设。

因此，使用“随机图像”时要非常小心！

在我图像的所有子方格上

至于你问题的这一部分，你基本上是在整个图像上运行一个滑动窗口。是的，实际上，它会起作用。但如果你正在寻找表现，这可能不是一个好主意。您可能希望运行一些分段算法，以缩小搜索范围。

我是否还有其他复杂的2级回卷/ RNN示例用于灵感？

我不确定复杂的2级犯规是什么意思。我不熟悉RNN，所以让我专注于回顾。你基本上可以自己定义卷积网。例如，卷积层大小，层数，最大池化方法是什么，完全连接层的大小等等。最后一层，基本上是一个softmax层，其中net决定了它的类是什么类是。如果您有2个类，则最后一个层有2个节点。如果你有3，那么3.依此类推。所以它的范围可以是2，甚至可能是1000.我没有听说有超过1000个班级的犯规，但我可能不了解情况。我希望这有帮助！

训练图像分类器 - 神经网络

2 个答案: