我正在研究回归问题。 我在R中使用RRF来实现此问题。 我制作了两个不同的数据集,一个用于训练,另一个用于测试。
library(RRF)
train=read.csv('training_data.csv'.header=F)
model <- RRF(as.numeric(V128) ~ .,data=train, flagReg = 1,importance=TRUE,ntree=1000, keep.forest=TRUE,type=regression,na.action=na.roughfix)
print(model)
Call:
RRF(formula = as.numeric(V128) ~ ., data = train, flagReg = 1, importance = TRUE, ntree = 1000, keep.forest = TRUE, type = regression, na.action = na.roughfix)
Type of random forest: regression
Number of trees: 1000
No. of variables tried at each split: 2656
Mean of squared residuals: 0.03509357
% Var explained: 81.5
现在,当我使用此模型预测测试集时。
test = read.csv('testing_data.csv',header=F)
predict(model,test,type="response")
给出所有测试数据集的NA。 当我尝试将其用于火车数据集时,它仍然给我相同的感觉。我根本没想到。
我跑步时
predict(model,new_data=test,type="response")
或
predict(model,new_data=train,type="response")
返回object中的包外预测。这意味着没有给出数据。 我应该怎么做才能得到预测?之后,我还想找到预测的准确性或性能。
答案 0 :(得分:0)
我目前也遇到了同样的问题。 This answer已经帮助我确定了NA预测概率的原因。简短的答案:您的功能(或预测变量)中存在NA。
我还在寻找其余建模过程的解决方案。当我有足够的信息可以解决您的其余问题时,我会回来更新此答案。
伦巴...