我有一个关于交叉验证时weka选择的测试数据实例索引的查询。如何打印正在评估的测试数据实例的索引?
=================================
我选择了:
数据集:iris.arff
实例总数:150
分类器:J48
交叉验证:10倍
我也将输出预测设为“ PlainText”
=============
在输出窗口中,我可以看到这样:-
inst#实际预测的错误预测
1 3:鸢尾鸢尾3:鸢尾鸢尾0.976
2 3:鸢尾鸢尾3:鸢尾鸢尾0.976
3 3:鸢尾鸢尾3:鸢尾鸢尾0.976
4 3:鸢尾鸢尾3:鸢尾鸢尾0.976
5 3:鸢尾鸢尾3:鸢尾鸢尾0.976
6 1:鸢尾鸢尾1:鸢尾鸢尾
7 1:鸢尾花1:鸢尾花1
... ... ...
总共10个测试数据集(每个中有15个实例)。
=====================
由于WEKA使用初始交叉验证,因此将随机选择测试数据集中的实例。
那么,如何打印测试数据的索引而原始文件中的数据却没有?
即
inst#实际预测的错误预测
1 3:鸢尾鸢尾3:鸢尾鸢尾0.976
此结果是针对主数据中的哪个实例(总共50个鸢尾属植物)?
===============
答案 0 :(得分:0)
经过大量搜索,我发现下面的youtube视频有助于解决上述问题。
希望这对以后有相同查询的访问者很有帮助。
Weka Tutorial 34: Generating Stratified Folds (Data Preprocessing)