我是深度学习的新手,我正在阅读一些最新技术论文,发现掩模r-cnn完全用于图像的分割和分类。我想将其应用于我的硕士学位论文,但我遇到了一些您可能会回答的问题。如果这不是正确的选择,我深表歉意。 首先,我想知道获得注释的最佳策略是什么。似乎有点劳动强度,我不知道是否有任何简便的方法。接下来,我想知道您是否知道用于掩码r-cnn的任何注释工具,该工具会生成由用户手动完成的二进制掩码。
我希望这可以成为一个富有成效和信息性的话题,因此,任何建议和经验都将受到高度赞赏。
亲切的问候, 路易斯
答案 0 :(得分:1)
我推荐使用MASK-RCNN,它是一个两阶段的框架,首先可以扫描图像并生成可能包含对象的区域。第二阶段对建议工程图边界框进行分类。
但有两个大问题
如何从头开始训练模型?当我们想要 训练我们自己的数据集?
您可以使用从Internet下载的注释,也可以开始创建自己的注释,这需要很多时间!
您拥有以下工具:
VIA GGC图像注释器 http://www.robots.ox.ac.uk/~vgg/software/via/via_demo.html
它在线上,您无需下载任何程序。这是我推荐的一种,将图像保存在.json文件中,因此您可以在MASK R-CNN框架中使用SAMPLES中默认提供的气球类,只需将json文件放入和您的图像,并训练您的数据集。
但是总是有更多选择,您有 labellimg ,它也用于注释,并且众所周知,但是将文件保存在xml中,您将必须对以下类进行一些更改:蟒蛇。您还具有 labelme,labelbox 等。