我正在尝试使用预测函数,但是输出没有我期望的试验次数。在读取其他错误后,我认为data.frame出了点问题,但无法解决。
我试图确保我的newdata与我的模型具有相同的变量名,但这不会解决。不同的行是找到的解决方案的数量不同,例如,我训练了50多种不同的信息集,而我测试了39950套。
train_data和test_data中都有10列,它们是每个计算中将包括的样本。模型会正确找到这些并将它们命名为test_data1,test_data2等。
我确定我想念一些东西,但似乎无法弄清楚。
trainingSampleSize <- k
sample_sample[[k-1]] <- sample(1:ncol(pre$train_data), k, replace = FALSE)
train_data <- pre$train_data[,sample_sample[[k-1]]]
test_data <- pre$test_data[,sample_sample[[k-1]]]
data_lm <- data.frame(train_data, pre$train_targets)
cvFitList[[(k-1)]] <- lm(pre$train_targets ~ train_data, data_lm)
prediction[[k-1]] <- predict(cvFitList[[(k-1)]], data.frame(train_data=test_data))
我的目标是对每组test_data进行预测,得到来自predict的39950个结果。
我收到警告消息:
'newdata'有39950行,但找到的变量有50行
和预测[[k-1]]只有50行