我正在RPART中使用决策树以如下所示断开连接率进行回归。我已按功能分组并计算了DT使用的费率。
m<-rpart(disco_rate ~ ., method='anova',data=x,minbucket=50,maxdepth=10,cp=0.01,xval=3)
但是,我需要在每次拆分时都计算disco_rate,并在此基础上做出拆分决策。为此,我通过了一个分别包含基数和迪斯科值的数据集来代替费率,并假设以下方法可以工作
m<-rpart(discos/base ~ ., method='anova',data=y,minbucket=50,maxdepth=10,cp=0.01,xval=3)
但是似乎它在开始时就计算disco_Rate,而不是在每个级别上都将discos / base函数用作因变量,因为两者的结果相同。
有没有办法使这种计算动态化?