应用错误收集

时间：2017-01-09 22:33:31

标签： computer-vision real-time image-segmentation object-detection object-recognition

我想分割室内区域并找到物体。然后，我想使用立体视觉来找到物体的笛卡尔位置。最终目标是通过机器人在桌子上拾取物体（并控制轨迹）。

对象示例：椅子，桌子，笔，注射器，订书机，杯子，螺丝，玩具娃娃，尺子，小盒子，牛奶，水果...... ....

我的首要任务是实时（10赫兹）。

我使用ZED立体相机在英特尔酷睿i7-3820（3.6 GHz）的Windows 10 64位，MATLAB 2016b 64位上捕获图像。

相机输出为720x2560像素，是两个（右图像和左图像）720x1280的组合。

我更喜欢使用无监督算法来查找桌面上未知对象的位置。但是，它应该是实时的。如果实时无法实现，我会降低我的期望，并使用有监督的算法来查找预定义的对象。

答案 0 :(得分：2)

我相信你提到的两个问题（分割和检测）仍然被视为开放性问题，因此，没有最终的解决方案。然而，在过去的几年中，已经做了很多工作来使用deeplearning来解决对象检测和语义分割，具有很好的性能和速度。

对于实时对象检测，我建议您检查YOLO和SSD的结果，并查看Faster R-CNN，因为您可以对10Hz的要求进行归档。

如果是对象细分，您可以尝试使用声称为8 fps的DCNN。还有其他一些，例如DeepLab或FCN，但我不清楚这些系统/架构的速度是多少。