我是数据挖掘的新手,对理解本书的摘录多标签分类问题分析和度量标准的实际含义有疑问/困惑。
“按照2×5策略对MLD进行了分区。这意味着存在 5次折叠的两次重复,并且每次运行都使用80%(4/5)的实例 培训和20%(1/5)进行测试。因此,对于每个>总共进行了10次运行 MLD。随机抽样用于选择每个折叠中的实例。全套 书库中提供了上述五个MLD的折页数”。
更新: 书籍存储库包含10对测试/培训文件,每对(组合)具有与原始数据集中的实例数量相同的实例数,但经过重组,然后按80%拆分为培训/测试数据集。当我分别对这些文件进行分类时,结果与作者的实验结果不符,所以……
问:他是指通过自动预处理创建这些单独的数据集,然后通过MEKA / MULAN进行批次分类吗?