我有一组带有三个标签的分类数据,'d','e'和'k'。我想训练一个分类器来识别'd'并从数据集中删除它们,然后识别'e'。目前,我正在将数据分成三部分,我将其称为X1,X2,X3。我在X1上训练学习者L1,使用该学习者删除X2上的'd'标签,然后我用它训练第二个学习者L2,我在X3上测试。这是一种合理的方法,在这种情况下是否存在可接受的标准?
答案 0 :(得分:0)
通常,有两种流行的技术可用于评估分类器的性能:交叉验证,使用整个数据集(使用数据的多个“折叠”)和保留集,它排除了一些数据培训评估。通常情况下,保留集远小于用于培训的数据(例如80/20或70/30)。
在这种情况下,一种选择是保持坚持;对学习集做任何学习和改变,即训练分类器,删除'd'元素,训练另一个分类器,识别'e'元素;然后针对您的保留集测试整个过程。