我的模型是使用一个包含180个观测值的数据集进行选择的,然后取出了4个异常值,因此有176个。我们必须在一个包含82个观测数据的测试数据集中使用它,但它会一直显示
警告:newdata有82行,但找到的变量有176行"。
我该如何解决这个问题?
以下是一些代码,但我并未将其全部发布,因为大多数代码与问题无关。提前谢谢!
OUTLIERS(XDATA=cbind(X3,X4,X5,X6,X9,X10),YDATA=Y)
#greatest outliers are 138, 161, 37, 116
#37 and 138 are very influential
#create dummy variables associated with factors
X2.=double(length(X2))
X2.[X2==2]=1
detach(diabetes)
data.=cbind(X2.,X3,X4,X5,X6,X9)
head(data.)
dim(data.)
lm(Y~data.)
fit9=lm(Y[c(-138,-161,-37,-116)]~data.[c(-138,-161,-37,-116),])
summary(fit9)
predictionA=predict(fit9,dataset$D.test)
predictionA