如何在R中设置C5.0包的成本矩阵?

时间:2013-08-13 10:00:12

标签: r decision-tree

我在网上搜索了很多内容,但是在R中找不到C5.0函数'cost'参数的任何有用描述。从C5.0 R手册中,它只是说“成本矩阵”与可能的错误相关联。矩阵应该有C列和行,其中C是类级别的数量“。它没有告诉我是否是模型的谓词结果。

有人可以帮忙吗?

1 个答案:

答案 0 :(得分:7)

以下是C5.0(版本0.1.0-15)的帮助页面中的引用:

  

成本矩阵应该由CxC表示,其中C是类的数量。   对角元素被忽略。列应该对应于true   类和行是预测的类。例如,如果C = 3   红色,蓝色和绿色(按此顺序),(2,3)中的值为5   矩阵的元素表示预测成本   绿色样本为蓝色,是通常值的五倍(一)。

按照帮助页面中的示例,这将是一个成本矩阵:

cost.matrix <- matrix(c(
  NA, 2, 4,
  3, NA, 5,
  7, 1, NA

), 3, 3, byrow=TRUE)

rownames(cost.matrix) <- colnames(cost.matrix) <- c("Red", "Blue", "Green")

cost.matrix

      Red Blue Green
Red    NA    2     4
Blue    3   NA     5
Green   7    1    NA

这意味着以下内容:

  • 将红色样本预测为蓝色,是通常值(一)的值的3倍
  • 将红色样本预测为绿色,是通常
  • 的7倍
  • 将蓝色样本预测为红色是使用值的2倍
  • 将蓝色样本预测为绿色是使用值的1倍
  • 将绿色样本预测为红色是使用值的4倍
  • 将绿色样本预测为蓝色是通常值的5倍