应用错误收集

没有固定的方法来确定何时具有足够的大小数据集。这取决于许多因素。最好的办法就是利用自己拥有的东西运行，并查看其性能。我通常将数据分成3组，分别是训练，验证和测试。我通常尝试进行75％的训练，15％的验证和10％的最终测试。验证集是我用来计算超级参数的时间。最初，我监视训练的准确性和损失。如果我可以将验证率提高到95％以上，那么我将监控验证的准确性和损失。我使用model_checkpoint keras回调函数来保存验证损失最小的模型。如果验证准确性和损失不令人满意，我将使用超参数来尝试改善它。我发现使用可调学习率可达到此目的。最后，当我对训练准确性和验证准确性感到满意时，我将使用保存的模型对测试集进行预测。这是模型性能的最终度量。

如何拆分测试和训练大小

1 个答案: