neural-network - 遮罩R-CNN实例分割与对象检测

遮罩R-CNN实例分割与对象检测

时间：2019-10-03 18:58:51

标签： neural-network classification object-detection image-segmentation

我有一个对象检测问题，其中我的数据由带有边界框的图像组成。我一直在审查几种先进的对象检测网络（https://paperswithcode.com/task/object-detection），并且在查看实例分割结束和对象检测开始的位置时遇到了麻烦。

我正在尝试找出使用边界框注释数据进行训练时，哪种方法效果最好。像遮罩R-CNN会比更快的R-CNN表现更好，还是要提高性能，是否需要在微调之前在像素级别对我的所有数据进行分割而不是用边框进行注释？如果在边界框上进行训练并且没有分段数据，那么掩码R-CNN是否会胜过更快的R-CNN？我知道您可以使用遮罩R-CNN进行边界框推断，但是您可以在不进行像素级分割的情况下训练模型吗？不需要进行像素级分割训练的最新的物体检测技术是什么？

2 个答案:

答案 0 :(得分：1)

像掩模R-CNN之类的东西会比更快的R-CNN表现更好吗，还是要提高性能，是否需要在微调之前将我的所有数据分割为像素级别而不是用边界框注释？

是的，面具R-CNN 确实需要在像素级别对数据进行分割，因为它是一种分割模型，比对象检测模型高一个级别，而且更复杂。

如果在边界框上训练且没有分段数据，蒙版R-CNN是否会比R-CNN更快？

否，面具R-CNN 是基于快速R-CNN 对象检测并添加了细分模块。因此，如果使用边界框注释数据，则更快的R-CNN 就足够了，使用 Mask R-CNN 毫无意义。

我知道您可以使用遮罩R-CNN进行边界框推断，但是您可以在不进行像素级分割的情况下训练模型吗？

是的，也许您可以通过这种方式训练模型，但是性能不会很好。这样做也是没有意义的，因为Mask R-CNN比Faster R-CNN稍慢。

不需要像素级分割训练的最新对象检测技术是什么？

在对象检测和分段之间进行选择取决于应用程序和您的目的。例如，如果您正在处理医学图像，并尝试检测肿瘤，则需要进行细分，但是例如，要在街道上检测汽车，您可能并不在意汽车的确切边界，而只是想知道汽车在图像上的位置。对于这种类型的应用程序，对象检测就足够了。对于最先进的对象检测（它也是实时的），我建议使用YOLO，因为它非常快，并且即使不是更好，其性能也比Faster R-CNN好。

答案 1 :(得分：1)

在Rohit Malhotra等人开发的工作中，只需添加更多上下文即可。 [1]作者使用深层的 Mask R-CNN 模型（一种用于对象实例细分的深度学习框架）来检测和量化个体数量。在这项工作中，他们使用 Mask R-CNN 来检测人数。同时，快速R-CNN [2]通过添加分支以预测每个感兴趣区域的分割掩码而扩展为 Mask R-CNN （ RoI ）生成于 更快的R-CNN 。最后，作者根据图像序列上的 Precision 和 Recall 测量了模型。结果显示在paper中。

此方法可用于收集可靠的，准确的数据，这些数据用于研究就诊政策的影响，医疗程序的频率和时机对患者睡眠-觉醒周期的影响，从而可以预测患者的结局，例如住院时间。 Mask R-CNN 还可以用于关键点检测，可以用于医院患者的姿势检测。

[1] Rohit Malhotra，K.，达沃迪，A.，Siegel，S.，Bihorac，A。和Rashidi，P.，2018年。使用深罩R-CNN自主检测重症监护室中的干扰。在IEEE计算机视觉和模式识别会议研讨会论文集（pp。1863-1865）中。

[2] Ren，S.，He，K.，Girshick，R.和Sun，J.，2015。更快的r-cnn：通过区域提议网络实现实时目标检测。在神经信息处理系统进展中（第91-99页）。