Keras 损失“NaN”;可能爆炸梯度

时间:2021-05-02 03:53:18

标签: python tensorflow keras deep-learning recurrent-neural-network

我正在运行一个 LSTM 模型来对天体物理学时间序列数据进行分类。我试图将每个时间序列分类为黑洞(1)或不是块洞(0)。当我运行我的 RNN 时,损失并没有减少(实际上是增加然后变为 NaN)。我无法弄清楚如何解决这个问题。这是我的 Jupyter Notebook 的链接(其中包含有关该问题的更多信息)。

https://colab.research.google.com/drive/1NJBEIdoeToqdcYooGEtrVfaELtLXwNjZ?usp=sharing#scrollTo=d_HDprISPjZT

如果您知道如何解决这个问题,请告诉我。

1 个答案:

答案 0 :(得分:0)

可能是ReLU;试试activation="tanh"

这里是无缘无故的附加文本,因为堆栈溢出认为人们永远无法简单地回答一个问题。