我一直在使用深度学习模型(以keras和tensorflow作为后端的CNN)进行图像分类,例如AlexNet和ResNet。我从整个数据集,学习,测试过程中学到了很多。
我现在正在转向对象检测,并做了很多研究。我遇到了R-CNN,Fast R-CNN,Faster R-CNN,Mask R-CNN和不同版本的YOLO网络。我注意到这些对象检测网络需要数据集注释,而不是前者仅需要将裁剪后的图像存储在相应文件中。 有什么方法可以完成对象检测而不必注释数据集吗?
答案 0 :(得分:0)
不,不是真的,深度学习不是魔术,您需要边界框注释。解决此问题的研究领域是弱监督对象检测,并且它是一个研究领域,没有解决方案能像使用带注释的数据集那样表现出色。
答案 1 :(得分:0)
深度学习是基于人工神经网络的更广泛的机器学习方法系列的一部分。 学习可以是有监督的,半监督的或无监督的。为了获得令人满意的结果,您必须使用带注释的数据集来训练模型。否则,DL就不会学习,为什么将其称为深度学习?
如果要避免数据注释,您正在寻找的是传统计算机视觉技术。视您的需要而定。
例如,如果要检测简单对象,可以使用Simple Blob Detector提取它们。
或者,如果要检测相同的对象,则可以使用图像比较技术,例如Template Matching或Feature Matching using SURF