我想像下面的视频一样创建阀门检测和分类:https://www.youtube.com/watch?v=VY92fqmSdfA 来检测阀门的打开和关闭和中间位置。
我已经进行了一些研究,并且找到了解决此问题的方法,但是我有一些条件可以解决此问题:
条件1:在应用程序中使用机器学习,我不能使用简单的方法,例如模板匹配,...
条件2:使用小型数据库(每类最少10张图像,每类最多40张图像)
条件3::如果摄像机位置发生变化,则检测阀门的位置,因此我不能仅使用颜色来检测阀门的手柄。
我想使用HOG(直方图梯度)+ SVM / ANN,但HOG需要大量图像来训练SVM / ANN。
我不知道我是否可以解决此问题?
答案 0 :(得分:0)
我们知道,机器学习方法要正常工作,最重要的是数据。因此,我想说您的第一个条件和第二个条件相互冲突。此外,您的第三个条件使问题更加复杂。您可以解决它,包括来自不同角度和光照条件的更多数据。但同样,它与条件2冲突。
即使如此,如果您想遵循ML路径,我建议您使用预先训练的模型,强大的数据增强功能,也许还可以使用一组模型来帮助提高检测率。由于问题并不难解决,因此应该可以解决。
祝你好运。