尽管标签相关性很强,为什么Multilabel性能结果与独立性能相同?

时间:2015-06-27 20:21:32

标签: scikit-learn label multilabel-classification scikit-multilearn

我有一个带有2个标签的数据集,我知道这两个标签之间有很强的相关性。但是,当我使用不考虑相关性的scikit multilearn二进制相关性时,我得到的结果与考虑这些标签相关性的Labelpowerset分类器非常相似?对此有何评论? 除了我使用http://scikit-multilearn.github.io/ 我不知道它有多有效?

1 个答案:

答案 0 :(得分:0)

我是scikit-multilearn的作者。为了回答您的问题,我需要查看标签组合的图表。两个标签产生4种组合,但如果组合[1,0]和[0,1]在[0,0]或[1,1]的情况下占主导地位,那么您可能会遇到Label Powerset无法解决的问题正确学习相关案例的基本分类器。它还取决于您使用哪种方法来验证性能?