Keras:介绍批量标准化后的NaN训练损失

时间:2017-02-19 21:34:01

标签: machine-learning deep-learning keras keras-layer

该模型的目标是对视频序列进行分类分类,其中每个输入是灰度,45帧,100x150视频序列(1,45,100,150),对应于单热编码的分类输出3个班级中的一个,例如[0,0,1]。以下是用于训练模型的脚本:

<!--
vim: ft=xml
-->
<!-- rest of file -->

引入批量标准化似乎导致培训损失很快就是NaN:enter image description here

1 个答案:

答案 0 :(得分:5)

好像你在网络中引入了nan输入。对于nan输入,您将获得nan输出。你有没有机会输入一个完整的数字?然后除以方差除以0 - >纳输入。

编辑:

你正在使用dim_ordering。因此,您需要批量标准化轴1.必须为批量标准化层指定。默认参数仅适用于tf dim_ordering。