我一直在阅读深度强化学习,例如:
https://www.nervanasys.com/demystifying-deep-reinforcement-learning/
在我理解所有数学之前还需要一段时间,但这并不能阻止我使用这些库。无论如何,我知道在卷积神经网络中,如果你想对图像进行学习,你必须对图像进行预处理,否则计算神经网络所需的计算能力是天文数字。这会以任何方式降低网络的质量吗?如果是这样的话?
例如,假设您有足够的计算能力为视频流中每个高质量图像的每个像素提供网络,以便学习如何实现目标。这会让网络更擅长实现其目标吗?它会扩大网络可以实现的目标类型,可能会使其更好地概括吗?
我也在计算机视觉的背景下考虑这一点,在这种情况下,你可能有机器人推理其环境以学习执行任务。似乎对它接收到的图像进行预处理将类似于将其视为非常差的视线。
答案 0 :(得分:1)
通过预处理图像,您的意思是将它们缩放到256x256像素的标准尺寸吗?
通过将图像下采样到256x256像素的大小,您将丢失信息,因此保持图像的高分辨率应该会给您带来更好的效果。
但它也会耗费你更多的电脑电量,所以这并不值得这么做。在Scaling up Image Recognition中,作者声称通过使用分辨率为512x512而不是256x256的图像,它们可以实现更低的错误率。然而它只下降了0.54%,这并不多。
在另一项任务中,我猜测使用更高分辨率图像的效果应该相似,它会让模型看到更多细节因此它可能会更好,但由于所需计算能力的增加,它可能不值得。 / p>
请注意,我提供的链接的作者在ImageNet上受到了欺骗,因此即使错误率的降低可能是真实的,也应该忽略在ImageNet竞赛中获得的分数。