RRF模型为测试集提供NA

时间:2018-07-03 06:51:02

标签: r machine-learning random-forest prediction

我正在研究回归问题。 我在R中使用RRF来实现此问题。 我制作了两个不同的数据集,一个用于训练,另一个用于测试。

    library(RRF)
    train=read.csv('training_data.csv'.header=F)
    model <- RRF(as.numeric(V128) ~ .,data=train, flagReg = 1,importance=TRUE,ntree=1000, keep.forest=TRUE,type=regression,na.action=na.roughfix)
    print(model)
    Call:
    RRF(formula = as.numeric(V128) ~ ., data = train, flagReg = 1,         importance = TRUE, ntree = 1000, keep.forest = TRUE, type = regression,      na.action = na.roughfix) 
           Type of random forest: regression
                 Number of trees: 1000
    No. of variables tried at each split: 2656

    Mean of squared residuals: 0.03509357
                % Var explained: 81.5

现在,当我使用此模型预测测试集时。

    test = read.csv('testing_data.csv',header=F)
    predict(model,test,type="response")

给出所有测试数据集的NA。 当我尝试将其用于火车数据集时,它仍然给我相同的感觉。我根本没想到。

我跑步时

    predict(model,new_data=test,type="response") 

    predict(model,new_data=train,type="response") 

返回object中的包外预测。这意味着没有给出数据。 我应该怎么做才能得到预测?之后,我还想找到预测的准确性或性能。

1 个答案:

答案 0 :(得分:0)

我目前也遇到了同样的问题。 This answer已经帮助我确定了NA预测概率的原因。简短的答案:您的功能(或预测变量)中存在NA。

我还在寻找其余建模过程的解决方案。当我有足够的信息可以解决您的其余问题时,我会回来更新此答案。

伦巴...