我想知道测试集的结果是否用于优化模型权重。我正在尝试建立模型,但是我遇到的问题是我没有太多数据,因为他们是医学研究患者。在我的情况下,患者人数有限(61),每个患者有5个特征向量。我试图通过排除一个主题来创建深度学习模型,然后将排除主题用作测试集。我的问题是受测者特征存在很大的差异,我的模型非常适合训练集(60个受测者),但不适用于1个排除的受测者。 因此,我想知道是否可以以某种方式使用测试集(在我的情况下为排除的主题)以使模型收敛,从而更好地对排除的主题进行分类?
答案 0 :(得分:3)
您不应在训练过程中使用数据集的测试数据。如果您的训练数据不够用,那么数据增强是这几天使用很多方法的方法(尤其是用于医学图像)。因此,我强烈建议您在训练过程中使用此技术。 How to use Deep Learning when you have Limited Data 是有关数据扩充的很好的教程之一。
答案 1 :(得分:0)
否,您不会使用测试集进行训练以防止过拟合,如果您使用交叉验证原理,则需要将数据精确地分成三个数据集:一个训练集,用于训练模型,验证集可以测试您的超参数的不同值,而测试集可以最终测试模型,如果您使用所有数据进行训练,则模型显然会过拟合。
如果您拥有大量且非常丰富的数据集,请记住一件事,深度学习就可以很好地工作