贝叶斯网络的混淆矩阵

时间:2010-05-30 21:18:03

标签: matrix probability data-mining bayesian-networks

我正在努力了解贝叶斯网络。我有一个有10个属性的数据文件,我想获取这个数据表的混淆表,我想我需要计算所有字段的tp,fp,fn,tn。这是真的吗?如果它是我需要为贝叶斯网络做的事情。

真的需要一些指导,我迷路了。

3 个答案:

答案 0 :(得分:4)

这个过程通常是这样的:

  • 您有一些标记的数据实例 你想用来训练一个 分类器,以便它可以预测 新的未标记实例的类。
  • 使用您的分类器 选择(神经网络,贝叶斯 net,SVM等...)我们建立一个 模型与您的训练数据 作为输入。
  • 此时,您通常会喜欢 评估的表现 部署之前的模型。所以用一个 以前未使用过的数据子集 (测试集),我们比较模型 这些情况的分类 与实际班级相反。一个 总结这些结果的好方法 是由混淆矩阵表明 每类实例如何 预测。

对于二进制分类任务,惯例是将一个类指定为正,另一个指定为否定。因此,从混淆矩阵中,正确分类为正的正实例的百分比被称为真阳性(TP)率。其他定义遵循相同的惯例......

答案 1 :(得分:3)

Confusion matrix用于评估分类器任何分类器的性能。

答案 2 :(得分:0)

你要问的是一个包含两个以上类的混淆矩阵。 以下是您的操作步骤:

  • 为每个类构建一个分类器,其中训练集包含在内 类中的文档集(正标签)及其 补充(否定标签)。
  • 给出测试文档,分别应用每个分类器。
  • 将文档分配给具有最高分数的班级 最大置信度值或最大概率

以下是您可以获得更多信息的论文参考:

Picca, Davide, Benoît Curdy, and François Bavaud.2006.Non-linear correspondence analysis in text retrieval: A kernel view. In Proc. JADT.