如何判断ctree是否只是一个根节点?

时间:2015-03-30 01:44:09

标签: r party

说我适合这样的模型:

ctree(Age ~ Kyphosis, data = kyphosis, mincriterion = 1)

我怎么能得到分裂的数量?我怎么能得到它是否只是一个根节点?

编辑:

使用的套餐:

library(caret)
library(party)
library(partykit)
library(plyr)
library(xtable)

我尝试使用下面答案中列出的tree.size时出错:

> tree.size(ctree(Age ~ Kyphosis, data = kyphosis, mincriterion = 1)@tree)
Error in tree.size(ctree(Age ~ Kyphosis, data = kyphosis, mincriterion = 1)@tree) : 
  trying to get slot "tree" from an object (class "constparty") that is not an S4 object 

2 个答案:

答案 0 :(得分:2)

在聚会包文档中,拟合模型中的tree插槽是树的递归表示。您可以构建自己的递归函数来确定树的大小:

tree.size <- function(tree) {
  if (is.null(tree)) {
    return(0)
  } else {
    return(1 + tree.size(tree$left) + tree.size(tree$right))
  }
}

我们可以使用仅包含根节点的树和具有多个节点的树来测试该函数:

library(rpart)  # for kyphosis
library(party)  # for ctree
mod1 <- ctree(Age ~ Kyphosis, data = kyphosis)
tree.size(mod1@tree)
# [1] 1
mod2 <- ctree(Petal.Width~., data=iris)
tree.size(mod2@tree)
# [1] 11

更新:根据更新的问题,OP似乎实际上使用partykit:::ctree函数而不是party:::ctree函数。事实证明,这更容易获得树大小,因为返回的模型是节点列表,因此所需要的只是length函数。

library(partykit)
mod1 <- partykit:::ctree(Age ~ Kyphosis, data = kyphosis)
length(mod1)
# [1] 1
mod2 <- partykit:::ctree(Petal.Width~., data=iris)
length(mod2)
# [1] 11

答案 1 :(得分:2)

对于这个问题的其他答案/讨论没有任何问题,我只想添加更多细节/上下文,以防其他用户遇到相同或类似的问题。

虽然旧ctree()和新party包中的partykit函数的许多方面保持不变,以便简化转换,但几乎所有的R和C代码都被重写了并简化和内部表示是全新的。旧的ctree()返回了一个S4对象,该对象对于我们想用它做的所有事情都不够灵活。新的ctree()函数返回继承自通用"constparty"类的类"party"的对象(对于每个节点中具有常量拟合的递归分区)。

可以使用length()方法查询节点数,使用width()方法查询终端节点数。 print()方法中也报告了节点数。最后,可以通过nodeids()查询节点ID。对于只有根节点的树:

data("kyphosis", package = "rpart")
library("partykit")

ct1 <- ctree(Age ~ ., data = kyphosis)
length(ct1)

[1] 1

width(ct1)

[1] 1

对于更大的树:

(ct2 <- ctree(Number ~ ., data = kyphosis))

Model formula:
Number ~ Kyphosis + Age + Start

Fitted party:
[1] root
|   [2] Start <= 15: 4.475 (n = 59, err = 152.7)
|   [3] Start > 15: 2.909 (n = 22, err = 17.8)

Number of inner nodes:    1
Number of terminal nodes: 2

length(ct2)

[1] 3

width(ct2)

[1] 2

nodeids(ct2)

[1] 1 2 3

nodeids(ct2, terminal = TRUE)

[1] 2 3

包装小插图还提供了许多其他有用的细节。 vignette("partykit", package = "partykit")对包及其类进行了一般性介绍; vignette("constparty", package = "partykit")描述了具有常量拟合的树的类; vignette("ctree", package = "partykit")提供有关ctree()的其他详细信息。