应用错误收集

时间：2020-07-13 13:56:37

标签： tensorflow model

我正在建立一个用于预测感觉的LSTM模型。我的数据集大约有248000条数据，我使用24000（约10％）作为验证集，其他是训练集。我的模型学习曲线如下： learning curve

从头开始，验证错误始终为0.00002，在第20个阶段，训练错误降低至0.013533。

我的验证集不具有代表性吗？解决方案是否使用更大的验证集？

答案 0 :(得分：0)

首先，您的基本概念可能非常简单，这导致早期的验证错误极低。其次，您的数据扩充使学习变得更加困难，从而产生更高的训练错误。

但是，在您的情况下，我仍然会进行一些实验。首先：将数据除以10/90而不是90/10，然后查看验证错误如何变化-希望您会看到（现在更短和更难）历元之间的某种曲线。其次，我将在训练之前（或在一批之后）进行验证，以产生随机结果。