我目前正在研究一个分类问题,我使用WEKA包中的FURIA算法来解决。我不确定“folds”参数是什么意思。文档指出,它“确定用于修剪的数据量。一次用于修剪,其余用于增长规则。”,我不知道如何解释,我也注意到随着增加“folds”参数的生成规则的数量趋于减少。这是否意味着,如果我将折叠设置为X训练数据将按照相应的19比1的比例在增长和修剪集之间划分,还是完全不同于其他?
答案 0 :(得分:0)
在规则学习阶段,数据将被划分为训练和测试数据。当n是折叠数时,训练数据和修剪数据之间的关系是(n-1)到1。
因此,当折叠次数相对于实例数和类数量过大时,可能会发生没有足够的测试数据来正确评估规则候选性能,从而选择&# 34;最好的"规则。