应用错误收集

我相对较新，但仍在学习基础知识。我过去使用过NVIDIA DIGITS，现在正在研究Tensorflow。虽然我已经摸索了为正在处理的几个项目创建一些模型的方式，但我真的很想开始更深入地研究自己的工作，做事的方式，并最终更好地理解为什么。

我要开始的一个领域是用于培训和测试的图像。谁能指出我的博客，文章，论文，或者让我对选择图像以训练新模型时需要考虑的问题有一些了解。直到最近，我一直在使用已经选择并可以下载的数据集。可以说，我将开始一个项目，该项目涉及从各种距离和角度对船舶进行物体检测。

所以我的想法是

1）我需要大量图像。 2）图像需要包含我要检测的不同类型的飞船。（我们只说一类船，不在乎什么类型的船） 3）对于不同类型的船舶，我还需要具有远距离透视的图像。

最终，我的想法是，这些图像需要反映出我理想地希望从视频中识别出的距离，视角和船只类型。似乎很简单。

但是，有很多问题

为了获得最佳效果，图像是否需要与我要使用的相机相同/相似的分辨率？图像是否都必须具有相同的分辨率？我可以只使用一张图像，而只是数字地缩小图像以给出不同距离的错觉吗？

我确定还有其他一些我没有问或应该问的问题。在创建用于训练和验证的图像集合时，是否有任何指南可用于创建可靠的图像集合？

我建议您进行端到端的思考，例如下一步是否需要对船舶模型进行分类？我建议浏览众所周知的公共数据集，并实际使用该结构，如何存储数据，标签，如何进行预处理等。

更重要的是，您要达到什么目标？在准备自己的数据集时，与该主题的专家交谈确实会有所帮助。

请尽可能使用开源图片，例如flickr，google，imagenet。

否，您不需要它们具有相同的分辨率。

放大/缩小图像以用于不同类别并不理想。预处理图像和数据增强已经做到了这一点，可以创建同一类的更远的表示。这就是为什么我建议首先尝试使用现有数据集的原因。

是的，您需要的是许多不同的类表示形式，以及大致平衡的类数据集。如果您在一开始就很好地定义了数据结构，那么它将节省大量时间，因为您无需经常进行更改。