我已经使用gensim库保存了我的文本向量,该库由一些负数组成。会影响培训吗? 如果不是,那为什么在经过一定的训练之后,为什么我先求鉴别器然后再求鉴别器和发电机的nan损失值?
答案 0 :(得分:1)
NaN损失的原因有很多,为什么模型会不同。我见过的最常见的是:
1e-8
这样的小数字。assert not np.any(np.isnan(x))
。如果以上方法均无济于事,请尝试检查激活功能,优化程序,损失功能,网络的大小和形状。
最后,尽管可能性较小,但您使用的框架可能存在错误。如果其他框架存在相同问题,请检查框架的仓库。