我对机器学习中的分类器集合有疑问。我已经阅读了Ensemble methods,但我无法将它们与我的想法联系起来。
如果我有一些多类问题的分类器,并且某些分类器对某些类表现出比其他类别更好的性能,我怎样才能在我的整体中利用这个特性呢?
例如。 与其他人相比,分类器A在1级中得分更高。 与其他人相比,分类器B在第2类中得分更高。 与其他人相比,分类器C在第3类中得分更高。 我怎么能做一个整体,以便我更加重视分类器A中第1类的概率并减少其余部分?
我在想一个简单的2层方法。 第1层:对于每个分类器,在内部根据各自的类性能在类之间加权,然后进行标准化。 第2层:每个分类器的权重,基于其整体F1表现
这会有意义吗?
Layer1 Model A Class1 Class2 Class3 Original 0.2 0.5 0.3 Weight 0.2*0.25 0.5*0.5 0.3*0.25 Equals 0.05 0.25 0.075 Normalise 0.133 0.66 0.2
Layer2 Models Class1 Class2 Class3 A 0.3*0.133 0.3*0.66 0.3*0.2 B 0.5*blah 0.5*blah 0.5*blah C 0.2*blah 0.2*blah 0.2*blah Avg Avg Avg Avg
谢谢。
答案 0 :(得分:0)
为什么你理论上可以对不同模型的结果进行不同的权重并得到更好的结果,你怎么能根据课程对它们进行不同的加权,考虑到任务是找到这个类?
您可以全局加权一些分类器。此外,一旦确定了一个类(即足够的分类器同意该类为X),您可以重新加权概率(例如,如果整体表示概率为60%并且该类上的某些可信分类器具有高概率,则可以让它80%)。但是,我不确定这在实践中会有所帮助。