训练和测试数据完全不同时的验证分区

时间:2018-08-22 14:06:23

标签: validation machine-learning neural-network training-data test-data

我正在尝试对电子鼻捕获的气味数据进行分类。我有两组分别用于火车和测试的数据:火车是由全新传感器捕获的气味剂,而测试是由同一传感器在受到污染后捕获的气味剂。

为了提高分类器的性能,我想引入一个验证分区来在训练期间测试模型的性能。问题是我不知道我应该从用于训练的数据还是从用于测试的数据中获取此分区,因为由于传感器污染,这些组中的每个组的模式都大不相同。

因此,如果我从训练数据中获取验证分区,我不确定它能否很好地估计模型在测试中的表现。如果我从测试数据中获取验证分区,我会担心它是否被视为“作弊”。尽管验证分区不会直接影响学习过程,但我一直读到验证分区应该从火车数据中获取,因此我不知道在火车和测试数据如此不同的特殊情况下如何进行验证。

0 个答案:

没有答案