如何获得所有终端节点 - 权重和在r中的响应预测'ctree'

时间:2012-12-19 19:11:08

标签: r data-mining decision-tree

这是我可以用来列出所有终端节点的权重的内容:但是我如何添加一些代码来获得响应预测以及每个终端节点ID的权重:

说我希望我的输出看起来像这样

enter image description here

- 以下是我到目前为止获得的重量

nodes(airct, unique(where(airct))) 

谢谢

2 个答案:

答案 0 :(得分:4)

二叉树是一个很大的S4对象,因此有时很难提取数据。

但是BinaryTree对象的绘图方法,有一个可选的面板函数,用于绘制终端节点的表单函数(节点)。因此,当您绘制图表时,您可以获得有关此节点的所有信息。

这里我使用plot函数来提取信息,甚至更好地使用gridExtra和package来将终端节点的形式更改为表

library(party)
library(gridExtra)
set.seed(100)
lls <- data.frame(N = gl(3, 50, labels = c("A", "B", "C")), 
                  a = rnorm(150) + rep(c(1, 0,150)),
                  b = runif(150))
pond= sample(1:5,150,replace=TRUE)
tt <- ctree(formula=N~a+b, data=lls,weights = pond)
output.df <- data.frame()
innerWeights <- function(node){

 dat <- data.frame (x=node$nodeID,
                    y=sum(node$weights),
                    z=paste(round(node$prediction,2),collapse='  '))
  grid.table(dat,
             cols = c('ID','Weights','Prediction'),
             h.even.alpha=1, 
             h.odd.alpha=1,  
             v.even.alpha=0.5, 
             v.odd.alpha=1)
   output.df <<- rbind(output.df,dat)  # note the use of <<-

}

plot(tt, type='simple', terminal_panel = innerWeights)


data
  ID Weights       Prediction
1  4      24  0.42  0.5  0.08
2  5      17 0.06  0.24  0.71
3  6      24    0.08  0  0.92
4  7     388 0.37  0.37  0.26

enter image description here

答案 1 :(得分:0)

这是我发现的,它可以通过一些额外的信息正常工作。但我只想在这里发布,以防将来有人需要它们。

y <- do.call(rbind, nodes(tt, unique(where(tt))))
write.table(y, 'clipboard', sep='\t') 

@ agstudy,让我知道你的想法。