我想分割室内区域并找到物体。然后,我想使用立体视觉来找到物体的笛卡尔位置。最终目标是通过机器人在桌子上拾取物体(并控制轨迹)。
对象示例:椅子,桌子,笔,注射器,订书机,杯子,螺丝,玩具娃娃,尺子,小盒子,牛奶,水果...... ....
我的首要任务是实时(10赫兹)。
我使用ZED立体相机在英特尔酷睿i7-3820(3.6 GHz)的Windows 10 64位,MATLAB 2016b 64位上捕获图像。
相机输出为720x2560像素,是两个(右图像和左图像)720x1280的组合。
我更喜欢使用无监督算法来查找桌面上未知对象的位置。但是,它应该是实时的。如果实时无法实现,我会降低我的期望,并使用有监督的算法来查找预定义的对象。
答案 0 :(得分:2)
我相信你提到的两个问题(分割和检测)仍然被视为开放性问题,因此,没有最终的解决方案。然而,在过去的几年中,已经做了很多工作来使用deeplearning来解决对象检测和语义分割,具有很好的性能和速度。
对于实时对象检测,我建议您检查YOLO和SSD的结果,并查看Faster R-CNN,因为您可以对10Hz的要求进行归档。
如果是对象细分,您可以尝试使用声称为8 fps的DCNN。还有其他一些,例如DeepLab或FCN,但我不清楚这些系统/架构的速度是多少。