我有一个包含20个功能的数据集。年龄10岁,体重10岁。我想分别对两者的数据进行分类,然后使用这两个分类器的结果作为最终结果的第三个数据的输入。
这可能与Weka ????
有关答案 0 :(得分:0)
在WEKA(或任何两个模型)中可以做出决策的融合,但不能使用您描述的方法。
作为使用分类器,每个模型只输出一个类。您可以使用作为第三个模型的特征生成的两个标签,但输入中缺乏多样性很可能会阻止第三个模型为您提供任何有趣的内容。
在最基本的层面上,您可以实施投票方案。给每个模型一个“投票”,然后假设正确的类是多数投票的类。虽然这将提供一种基本的融合形式,但如果你熟悉voting theory,你知道当你有两个以上的课时,多数规则会有所分离。
我建议您使用Combinatorial Fusion融合两个分类器的输出。有关该技术的优秀论文可作为免费的PDF here获得。实质上,您使用WEKA分类器提供的Classifer :: distributionForInstance()方法,然后使用分布的总和(称为“分数”)对类进行排名,选择排名最高的类。该论文表明,这种方法优于单独投票。