因此,我将卷积层用作神经网络的第一层,以进行深度强化学习,从而从我构建的模拟中获得空间特征。该模拟给出了要处理的具有不同长度和高度的不同地图。如果我了解卷积网络,那么这无关紧要,因为通道大小保持恒定。在卷积网络和完全连接的层之间,存在一个空间金字塔池化层,因此变化的图像大小无关紧要。而且空间数据非常稀疏。通常,在第一个卷积层吐出所有Nans之前,它能够经历一些状态,有时甚至是几集。即使我固定了地图大小,也会发生这种情况。我不知道问题在哪里,问题在哪里?
答案 0 :(得分:0)
尝试使用0到1之间的随机数初始化您的权重,然后尝试不同的学习率进行网络训练。 (我建议以学习率等于10、1、0.1、0.01等来测试它)