所以我在R包聚会中使用ctree时遇到问题。我无法使用partykit软件包,因为它无法在> = 31级
中搜索无序拆分我使用了以下代码:
set.seed(1234) #To get reproducible result
ind <- sample(2,nrow(newnew_compressed_data), replace=TRUE, prob=c(0.7,0.3))
trainData <- newnew_compressed_data[ind==1,]
testData <- newnew_compressed_data[ind==2,]
myFormula <- MA ~ .
abundance_ctree <- party::ctree(myFormula, data=trainData)
abundance_ctree2 <- party::ctree(myFormula, data=testData)
print(abundance_ctree)
plot (abundance_ctree)
plot(abundance_ctree, type="simple")
plot (abundance_ctree2)
其中MA
是我的y变量,newnew_compressed_data
是我的数据集。该数据集包含1032个观测值和7个变量,这些重要性正在测试中。
这是当前树在当前时刻的样子:
您可以看到标签显示了类别中的每个项目,我希望将其打印或放入表格中!另外,我不确定每个节点对应哪个,输出显示我有13个节点...
是否有人知道降低级别并产生更好的图例以解释每个节点中表示的方法?我只是无法解释任何事情,并努力寻找具有大型数据集的示例。