我正在建立一个卷积网络模型,我想用该模型对EEG数据进行分类。数据是一项实验,参与者通过3个不同类别(每个类别2个子类别)的图像来诱发参与者。为了简要说明数据集的大小,一个子类具有给定参与者的±300个纪元(这适用于所有子类)。
现在我的问题是: 我的训练数据集中有5名参与者,我从每个参与者的数据中提取了15%,并将其放入测试数据集中。即使使用相同的参与者来训练模型,我也可以认为这15%是看不见的数据吗?
欢迎任何输入!
答案 0 :(得分:1)
这取决于您要测试的内容。测试集用于估计一般性(即对看不见的数据的性能)。所以问题是:
这实际上取决于您的目标或您要提出的主张。我可以想到两种方法的情况: