标签: tensorflow keras deep-learning recurrent-neural-network
我正在Keras中训练GRU模型以进行回归任务。在训练期间,有两个连续的时期比其他时期花费了更多的时间(两个数量级)。 (据我所知)我的计算机上没有同时运行任何其他资源密集型任务。可能是什么原因造成的?
训练数据由20k个长度为512,尺寸为10的序列组成。该模型是单个GRU,具有128个单位,递归丢失为0.2。所使用的优化程序是Adam,其lr初始化为0.01,并在平稳阶段减小(在异常时期为0.00025)