对于Weka Explorer(GUI),当我们为任何给定的 ARFF 文件执行10倍的CV时,Weka Explorer提供的内容(据我所知)是所有人的平均结果10倍。
问。有没有办法获得每个折叠的结果?例如,我需要每个折叠的错误率(错误识别的实例)。
帮助表示赞赏。
答案 0 :(得分:15)
我认为使用Weka的GUI可以 。您需要使用Experimenter而不是Explorer。以下是步骤:
Experimenter
New
按钮@右上角)Results Destination
中输入文件名和位置以将结果保存到Number of (cross-validation) folds
(开始尝试2次以获得简单的结果)Number of repetitions
(我建议1开始使用)Run
标签和Start
实验并等到完成Analyse
标签,点击Experiment
(右上角)导入实验结果
Row
选择:Fold
Column
:Percent_incorrect
或Number_incorrect
(或您希望查看的任何其他指标)答案 1 :(得分:3)
使用交叉验证选项时,Weka Explorer没有选项可以为单个折叠提供结果,但有一些解决方法。如果您明确地不想更改任何代码,则需要进行一些手动调整,但我认为这或多或少会提供您想要的内容
Cross-validation
并将其设置为90%Percentage split
More options...
并将Random seed for XVal / % Split
值更改为之前未使用的值。这并不完全相当于10倍交叉验证,因为你这样做的伪折叠可能会重叠。
相当于交叉验证的替代方法,但更麻烦的是,使用无监督的实例过滤器RemoveFolds
或RemoveRange
手动进行10次折叠。
生成并保存10个训练集和10个测试集。然后对于每个折叠,加载训练集,在分类选项卡中选择Supplied test set
,然后选择适当的测试折叠。