我想知道,您使用默认的架构通常会训练几个时期来训练mozilla深度语音。 (与GitHub版本相比无变化)。要运行多少个时期,特别是考虑到可用基础架构上的每个时期都需要花费大量时间?((Tesla K80单个GPU))
另一方面,如果提前停止(默认条件),该数字是多少?感谢您的建议/建议。
培训数据:简历
答案 0 :(得分:0)
一个好的经验法则是,只要模型学习,即只要验证误差在训练误差以下,它就可以运行。您可以在运行时对其进行监视,因为它已打印到控制台,或通过例如参数dropout_rate。如果将其设置为0.1,则当验证错误与训练错误非常接近时,它将停止。
当然,它还取决于其他参数设置和您的数据。