我是计算机视觉的新手。我正在研究一个研究项目,其目标是(1)从图像和视频中检测车辆,然后在(2)能够跟踪移动车辆。
我正处于收集训练数据的初始阶段,我真的很关心能够获得最佳分辨率的图像进行检测和跟踪。
有什么想法吗?我给出的当前数据集(来自过去的项目)具有大约1200x600像素的图像。但我被告知这可能是也可能不是检测和跟踪任务的最佳分辨率。除了考虑我将从图像中提取类似哈尔的特征这一事实之外,我想不出任何因素可以包括在做出解决方案的决定中。在这种情况下,对于训练数据图像应该有什么好的解决方案的想法?
答案 0 :(得分:3)
首先,将原始图像直接输入分类器并不会产生很好的效果,尽管有时候会有用,例如面部检测。所以你需要考虑特征提取。
一个大问题是1200x600有720,000像素。这定义了720,000个维度,由于维度爆炸,它对培训和分类构成了挑战。
所以基本上你需要缩小你的尺寸,特别是使用特征提取。要检测哪些功能?这完全取决于域名。
另一个重要方面是速度。处理更大的图像需要更多的时间,这对于处理15-30 fps的实时图像尤为重要。
在我的项目(参见我的个人资料)中实时(15fps),我正在处理640x480图像,对于某些操作,我不得不缩小以提高性能。
希望这有帮助。