如何在Weka GUI中识别错误分类的实例的细节?

时间:2018-04-10 06:00:47

标签: machine-learning nlp classification weka data-mining

我想使用Weka GUI获取错误分类的实例的详细信息(唯一ID )。我正在关注this question的答案。在这种情况下,他们要求使用预处理选项卡中的过滤器CMake Error at /usr/share/cmake/Modules/CMakeDetermineSystem.cmake:99 (message): Could not find toolchain file: /tmp/mytoolchainfile Call Stack (most recent call first): CMakeLists.txt:131 (project) CMake Error: Error required internal CMake variable not set, cmake may be not be built correctly. Missing variable is: CMAKE_C_COMPILER_ENV_VAR CMake Error: Could not find cmake module file: /tmp/libwebsockets/build/CMakeFiles/2.8.12.2/CMakeCCompiler.cmake -- Configuring incomplete, errors occurred!来转换唯一ID ,这是一个字符串。但是,通过这样做,我怀疑分类器是否在分类过程中将唯一ID 列视为一个特征?

请建议我接近这个的正确方法。

如果需要,我很乐意提供示例。

1 个答案:

答案 0 :(得分:2)

假设您想要(1)添加实例ID,(2)不在模型中使用该实例ID,(3)使用实例ID和其他一些属性查看各个预测

我们将用较小的数据集来显示它。例如,打开iris.arff。

使用Preproc选项卡中的Unsupervised Attribute过滤器中的AddID过滤器。 ID将是第一个属性。

现在我们需要在建模过程中忽略它。将筛选的分类器与“删除”筛选器一起使用。 Remove filter

我们需要输出带有ID变量的预测,以便我们可以看到发生了什么。这里我们输出所有属性,虽然我们不需要全部。 Ask for instance output with predictions

我们在输出窗口中得到了这个细节:

=== Predictions on test split ===

inst#,actual,predicted,error,prediction,ID,sepallength,sepalwidth,petallength,petalwidth
1,2:Iris-versicolor,2:Iris-versicolor,,0.968,53,6.9,3.1,4.9,1.5
2,3:Iris-virginica,3:Iris-virginica,,0.968,131,7.4,2.8,6.1,1.9
3,2:Iris-versicolor,2:Iris-versicolor,,0.968,59,6.6,2.9,4.6,1.3
4,1:Iris-setosa,1:Iris-setosa,,1,36,5,3.2,1.2,0.2
5,3:Iris-virginica,3:Iris-virginica,,0.968,101,6.3,3.3,6,2.5
6,2:Iris-versicolor,2:Iris-versicolor,,0.968,88,6.3,2.3,4.4,1.3
7,1:Iris-setosa,1:Iris-setosa,,1,42,4.5,2.3,1.3,0.3
8,1:Iris-setosa,1:Iris-setosa,,1,8,5,3.4,1.5,0.2

等等。