应用错误收集

WEKA：在交叉验证时打印原始数据的测试数据实例索引

时间：2018-11-09 07:56:10

标签： weka cross-validation test-data

我有一个关于交叉验证时weka选择的测试数据实例索引的查询。如何打印正在评估的测试数据实例的索引？

=================================

我选择了：

数据集：iris.arff

实例总数：150

分类器：J48

交叉验证：10倍

我也将输出预测设为“ PlainText”

=============

在输出窗口中，我可以看到这样：-

inst＃实际预测的错误预测

1 3：鸢尾鸢尾3：鸢尾鸢尾0.976

2 3：鸢尾鸢尾3：鸢尾鸢尾0.976

3 3：鸢尾鸢尾3：鸢尾鸢尾0.976

4 3：鸢尾鸢尾3：鸢尾鸢尾0.976

5 3：鸢尾鸢尾3：鸢尾鸢尾0.976

6 1：鸢尾鸢尾1：鸢尾鸢尾

7 1：鸢尾花1：鸢尾花1

... ... ...

总共10个测试数据集（每个中有15个实例）。

=====================

由于WEKA使用初始交叉验证，因此将随机选择测试数据集中的实例。

那么，如何打印测试数据的索引而原始文件中的数据却没有？

即

inst＃实际预测的错误预测

1 3：鸢尾鸢尾3：鸢尾鸢尾0.976

此结果是针对主数据中的哪个实例（总共50个鸢尾属植物）？

===============

1 个答案:

答案 0 :(得分：0)

经过大量搜索，我发现下面的youtube视频有助于解决上述问题。

希望这对以后有相同查询的访问者很有帮助。

Weka Tutorial 34: Generating Stratified Folds (Data Preprocessing)