训练图像?选择注意事项

时间:2018-10-02 18:00:08

标签: tensorflow deep-learning caffe object-detection

我相对较新,但仍在学习基础知识。我过去使用过NVIDIA DIGITS,现在正在研究Tensorflow。虽然我已经摸索了为正在处理的几个项目创建一些模型的方式,但我真的很想开始更深入地研究自己的工作,做事的方式,并最终更好地理解为什么。

我要开始的一个领域是用于培训和测试的图像。谁能指出我的博客,文章,论文,或者让我对选择图像以训练新模型时需要考虑的问题有一些了解。直到最近,我一直在使用已经选择并可以下载的数据集。可以说,我将开始一个项目,该项目涉及从各种距离和角度对船舶进行物体检测。

所以我的想法是

1)我需要大量图像。 2)图像需要包含我要检测的不同类型的飞船。 (我们只说一类船,不在乎什么类型的船) 3)对于不同类型的船舶,我还需要具有远距离透视的图像。

最终,我的想法是,这些图像需要反映出我理想地希望从视频中识别出的距离,视角和船只类型。似乎很简单。

但是,有很多问题

为了获得最佳效果,图像是否需要与我要使用的相机相同/相似的分辨率? 图像是否都必须具有相同的分辨率? 我可以只使用一张图像,而只是数字地缩小图像以给出不同距离的错觉吗?

我确定还有其他一些我没有问或应该问的问题。在创建用于训练和验证的图像集合时,是否有任何指南可用于创建可靠的图像集合?

1 个答案:

答案 0 :(得分:1)

我建议您进行端到端的思考,例如下一步是否需要对船舶模型进行分类?我建议浏览众所周知的公共数据集,并实际使用该结构,如何存储数据,标签,如何进行预处理等。

更重要的是,您要达到什么目标?在准备自己的数据集时,与该主题的专家交谈确实会有所帮助。

请尽可能使用开源图片,例如flickr,google,imagenet。

否,您不需要它们具有相同的分辨率。

放大/缩小图像以用于不同类别并不理想。预处理图像和数据增强已经做到了这一点,可以创建同一类的更远的表示。这就是为什么我建议首先尝试使用现有数据集的原因。

是的,您需要的是许多不同的类表示形式,以及大致平衡的类数据集。如果您在一开始就很好地定义了数据结构,那么它将节省大量时间,因为您无需经常进行更改。