WEKA:在交叉验证时打印原始数据的测试数据实例索引

时间:2018-11-09 07:56:10

标签: weka cross-validation test-data

我有一个关于交叉验证时weka选择的测试数据实例索引的查询。如何打印正在评估的测试数据实例的索引?

=================================

我选择了:

数据集:iris.arff

实例总数:150

分类器:J48

交叉验证:10倍

我也将输出预测设为“ PlainText”

=============

在输出窗口中,我可以看到这样:-

inst#实际预测的错误预测

1 3:鸢尾鸢尾3:鸢尾鸢尾0.976

2 3:鸢尾鸢尾3:鸢尾鸢尾0.976

3 3:鸢尾鸢尾3:鸢尾鸢尾0.976

4 3:鸢尾鸢尾3:鸢尾鸢尾0.976

5 3:鸢尾鸢尾3:鸢尾鸢尾0.976

6 1:鸢尾鸢尾1:鸢尾鸢尾

7 1:鸢尾花1:鸢尾花1

... ... ...

总共10个测试数据集(每个中有15个实例)。

=====================

由于WEKA使用初始交叉验证,因此将随机选择测试数据集中的实例。

那么,如何打印测试数据的索引而原始文件中的数据却没有?

inst#实际预测的错误预测

1 3:鸢尾鸢尾3:鸢尾鸢尾0.976

此结果是针对主数据中的哪个实例(总共50个鸢尾属植物)?

===============

1 个答案:

答案 0 :(得分:0)

经过大量搜索,我发现下面的youtube视频有助于解决上述问题。

希望这对以后有相同查询的访问者很有帮助。

Weka Tutorial 34: Generating Stratified Folds (Data Preprocessing)