我不确定哪个分类器在以下两个中更好:
Classifier 1 - Training set = 100%, Test set 70%
和
Classifier 2 - Training set = 70%, Test set 75%
我需要争论分类器1优于分类器2。
他们都有他们的专业人士和小伙伴,但我没有具体的答案?
答案 0 :(得分:4)
第二个可能更好。
第一个分类器显然患有overfit。换句话说,它不是学习训练集的基本原理,而是学习对数据的详尽描述。
这并不意味着第二个分类器很棒。但是,一般来说,如果A的测试集上的性能优于B,则分类器A优于分类器B.
答案 1 :(得分:2)
根据您提供的详细信息,与分类器2相比,分类器1似乎过度装配到训练集,因此对测试集的表现更差。这表明分类器2在测试集方面“更好”。
如果你想以另一种方式争论,你可能需要指出一些关于分类器1的具体信息 - 例如它是如何训练的,使用了什么算法。