我从this article开始工作:“一种使用集成学习预测肾结石类型的新方法”。作者使用了一种遗传算法来找到用于WEKA投票的最佳权向量,但我不知道他们能做到这一点。如何使用遗传算法通过WEKA查找投票分类器的权重?
以下段落摘录自文章:
为了提高投票算法的性能,对加权 使用多数票。简单的多数投票算法通常是 组合不同分类器(但不是全部)的有效方法 分类器对分类问题具有相同的作用。至 优化权重多数投票分类器的结果,我们需要 找到最佳权重向量。应用遗传算法是我们的 解决此问题的最佳权向量的方法。
答案 0 :(得分:1)
假设您拥有一些训练有素的分类器和测试集,则可以创建方法calculateFitness(double[] weights)
。在此方法中,对于每个Instance
,根据weights
计算所有预测和合并的预测。使用组合的预测和实际值来计算要最大化/最小化的总分。
使用calculateFitness方法,您可以创建自定义GA以找到最佳权重。