Question

我正在尝试使用预测函数，但是输出没有我期望的试验次数。在读取其他错误后，我认为data.frame出了点问题，但无法解决。

我试图确保我的newdata与我的模型具有相同的变量名，但这不会解决。不同的行是找到的解决方案的数量不同，例如，我训练了50多种不同的信息集，而我测试了39950套。

train_data和test_data中都有10列，它们是每个计算中将包括的样本。模型会正确找到这些并将它们命名为test_data1，test_data2等。

我确定我想念一些东西，但似乎无法弄清楚。

trainingSampleSize <- k
sample_sample[[k-1]] <- sample(1:ncol(pre$train_data), k, replace = FALSE)
train_data <- pre$train_data[,sample_sample[[k-1]]]
test_data <- pre$test_data[,sample_sample[[k-1]]]
data_lm <- data.frame(train_data, pre$train_targets)
cvFitList[[(k-1)]] <- lm(pre$train_targets ~ train_data, data_lm)
prediction[[k-1]] <- predict(cvFitList[[(k-1)]], data.frame(train_data=test_data))

我的目标是对每组test_data进行预测，得到来自predict的39950个结果。

我收到警告消息：

'newdata'有39950行，但找到的变量有50行

和预测[[k-1]]只有50行

如何修复预测函数中的“差异行”错误？

0 个答案: