基于试验的数据集的k折交叉验证

时间:2017-03-01 10:48:12

标签: modeling cross-validation

我的脑电数据集包含一些科目的数据,每个科目有4个部分 主要论文采用以下方法:
它为主题使用了两个部分。第一部分用作训练数据,第二部分用作测试集 我想使用k-fold交叉验证,但我需要注意纸张方法的条件(第1部分作为训练集,第2部分作为测试集)。
首先,我需要将我的数据分成k个部分,然后使用k-1部分作为列车,另外1个作为测试,并在k循环中执行此过程。 我的数据分为两个部分,如何在一个部分中看到两个部分?可以混合数据吗? 如果我混合它们我应该如何使用纸张的条件? 提前谢谢。

1 个答案:

答案 0 :(得分:1)

首先你的问题很模糊!你没有解释条件是什么或应该是什么。
无论如何,在K-Fold中,您的数据被统一划分为k个大小相等的子样本。在这些k子样本中,每次分离单个子样本并将其用作验证集,其余子样本用作训练集。此过程重复k次(折叠),直到所有分区仅用作验证一次。然后可以对折叠的k结果进行平均以产生单个估计。

我没有准确地得到你所指的主题,但如果论文分别使用第1部分和第2部分进行培训和测试(验证),你可以做以下任何一种情况:

  1. 您可以组合这两个部分,然后在这个新合并的数据集上应用K-fold。
  2. 预留测试数据(第二部分),在第一部分运行k-fold,因此您将获得k-1折叠用于训练,1用于验证 用于查找/微调参数/网络/模型, 和一个最终用于测试的测试集