我有一个带有2个标签的数据集,我知道这两个标签之间有很强的相关性。但是,当我使用不考虑相关性的scikit multilearn二进制相关性时,我得到的结果与考虑这些标签相关性的Labelpowerset分类器非常相似?对此有何评论? 除了我使用http://scikit-multilearn.github.io/ 我不知道它有多有效?
答案 0 :(得分:0)
我是scikit-multilearn的作者。为了回答您的问题,我需要查看标签组合的图表。两个标签产生4种组合,但如果组合[1,0]和[0,1]在[0,0]或[1,1]的情况下占主导地位,那么您可能会遇到Label Powerset无法解决的问题正确学习相关案例的基本分类器。它还取决于您使用哪种方法来验证性能?