我是机器学习的新手。我有一个任务是使用机器学习概念从图像中找到车辆的总数。我正在使用神经网络。我在这里给出了最坏情况的图像。
我需要从这张图片中找到汽车总数。我的想法是将这个大图像切割成小块图像并训练网络从小块中计算车辆。每个补丁的计数都小于5.然后在处理新图像时,我可以使用滑动窗口来获取车辆的总数。
我只是想知道这个想法是否可行或者我应该选择特征提取和训练具有这些功能的神经网络。如果可能,数据集和培训是否有任何条件。
答案 0 :(得分:5)
您要找的是对象检测。起点可以是Deep Neural Networks for Object Detection或Region-based Convolutional Networks for Accurate Object Detection and Segmentation。
类似但更困难的任务是实例细分。我在这方面看到的最新论文之一是Pixel-level Encoding and Depth Layering for Instance-level Semantic Labeling。
实例细分可能是计算机视觉中最难的任务。当您刚接触机器学习/计算机视觉时,您可能首先想要进行图像分类。如果你想进入实例分割的方向,那么你应该继续进行语义分割,然后再进行实例分割。
一个简单的滑动窗口方法,你只预测“汽车”/“没有汽车”是行不通的,因为在图像中汽车没有被任何“无车”分开。