R中的分类树限制为32级

时间:2016-06-07 11:41:54

标签: r tree classification

我正在尝试使用包树在R中创建分类树。

这是我正在使用的数据集的摘录(包括标题):

public void doPost( final HttpServletRequest request, final HttpServletResponse response )
    throws ServletException, IOException {
  String contentLength = request.getHeader("Content-Length");
  if (contentLength != null && maxRequestSize > 0 && 
           Integer.parseInt(contentLength) > maxRequestSize) {
     throw new MyFileUploadException("Multipart request is larger than allowed size");
  }
}

这是我发给R的命令:

CENTRO_EXAMEN,NOMBRE_AUTOESCUELA,MES,TIPO_EXAMEN,NOMBRE_PERMISO,PROB
Alcal· de Henares,17APTOV,5,PRUEBA DESTREZA,A2 ,0
Alcal· de Henares,17APTOV,5,PRUEBA CONDUCCION Y CIRCULACION,B  ,0.8
Alcal· de Henares,17APTOV,5,PRUEBA TEORICA,B  ,0.333333333
Alcal· de Henares,2000,5,PRUEBA TEORICA,B  ,0
发出tree.madrid

后,

R返回以下错误

madrid=read.csv("madrid.csv",header=T,na.strings="?")
#madrid=na.omit(madrid)
names(madrid)
dim(madrid)
fix(madrid)
library(tree)
attach(madrid)

#costruisce albero
High=ifelse(PROB<=0.5,"No","Yes")
madrid=data.frame(madrid,High)
tree.madrid=tree(High~CENTRO_EXAMEN+NOMBRE_AUTOESCUELA+MES+TIPO_EXAMEN+NOMBRE_PERMISO,madrid)
summary(tree.madrid)
plot(tree.madrid)
text(tree.madrid,pretty=0)
tree.madrid

知道为什么吗?

1 个答案:

答案 0 :(得分:1)

基本上,在数据中创建如此多的拆分会变得计算成本,因为您正在从所有2 ^ 32(近似)可能的拆分中选择最佳拆分。

如果您能够使用随机森林,Ben的评论here表明randomForest现在可以处理多达53个级别。如果由于某种原因无法使用随机森林,则可以考虑折叠分类预测器的级别。