MLR中的重采样错误

时间:2016-10-04 17:53:37

标签: r mlr

我的任务是对回归任务进行分层,数据看起来像

f1,f2,f3,... m1,m2 ...,p1,p2,p3 ...

其中f_i是数字,其他列是因子和整数。

现在,在运行以下

之后,我定义了一个自定义度量m1
measures1 = list(m1, medae) 
measures2 = lapply(measures1, setAggregation, train.mean)
measures = c(measures1, measures2)
# rdesc = makeResampleDesc("CV", iters = 3, predict = "both", stratify.cols = "Iodine" ) #Default is 2/3, both=train&test
rdesc = makeResampleDesc("CV", iters = 3, predict = "both" ) #Default is 2/3

我收到错误说

[Resample] cross-validation iter: 1
Error in `contrasts<-`(`*tmp*`, value = contr.funs[1 + isOF[nn]]) : 
  contrasts can be applied only to factors with 2 or more levels

当我将输入数据框子集化为仅包含数字数据时,没有这样的错误,事实上只有数值数据对预测有用,但我需要其他列在列车测试分割中进行分层。谁知道出了什么问题?

1 个答案:

答案 0 :(得分:0)

事实证明是使用

rapply(dat,function(x)length(unique(x)))

我可以发现有一列只有1个唯一值,问题解决了。