我已经训练了一个模型,我试图使用predict
函数,但它返回以下错误。
contrasts<-
中的错误(*tmp*
,值= contr.funs [1 + isOF [nn]]):
对比只能适用于具有2级或更多级别的因素
SO和CrossValidated中有几个问题,我将此错误理解为,我的模型中的一个因素只有一个级别。
这是一个非常简单的模型,有一个连续变量(driveTime)和一个有3个级别的因子变量
driveTime Market.y transfer
Min. : 5.100 Dallas :10 Min. :-11.205
1st Qu.: 6.192 McAllen: 6 1st Qu.: 3.575
Median : 7.833 Tulsa : 3 Median : 7.843
Mean : 8.727 Mean : 8.883
3rd Qu.:10.725 3rd Qu.: 15.608
Max. :14.350 Max. : 30.643
当我使用预测函数来确定未见样本的结果时
newDriveTime <- data.frame(driveTime = 8,Market.y = as.factor("Dallas"))
predict(bestMod_Rescaled, newDriveTime)
我收到以下错误
Error in `contrasts<-`(`*tmp*`, value = contr.funs[1 + isOF[nn]]) :
contrasts can be applied only to factors with 2 or more levels
以下是我的工作流程
tc <- tune.control(cross = 10, fix = 8/10)
tuneResult_Rescaled <- tune(svm,data = finalSubset,
transfer~ driveTime + Market.y,
ranges = list(epsilon = seq(0.1,.5,0.1),
cost = seq(8,10,.1)), tunecontrol=tc)
summary(tuneResult_Rescaled)
bestMod_Rescaled <- tuneResult_Rescaled$best.model
答案 0 :(得分:1)
我认为你必须将训练数据中的因子水平提供给测试集。以下内容应该有效。
newDriveTime <- data.frame(driveTime = 8,
Market.y = factor("Dallas", levels(finalSubset$Market.y)))
predict(bestMod_Rescaled, newDriveTime)
在R中,因子被保存为带有名称/标签的整数。如果您有两个具有不同级别的因子向量,只需查看标签,就无法确定哪些标签是两个向量中的相应级别。