我正在尝试使用以下代码在R中创建一个随机林:
forest <-
randomForest(Responder_7yr ~ CD4_num_log + CD8_num_log + anergy_CD8_num_log +
anergy_CD4_num_log + part_exhaust_CD8_num_log + exhaustion_CD8_num_log +
exhaustion_CD4_num_log + senescence_CD8_num_log +
senescence_CD4_num_log + tcm_CD4negCD8pos_num_log +
nTreg_CD4posCD8neg_num_log + ln_cpep + A1C + Ins,
data=resp, na.action=na.omit, importance=TRUE)
我收到以下错误:
Error in `[.default`(table(observed = y, predicted = out.class), levels(y), :
subscript out of bounds
我已经确认所有预测变量都是正确的格式,结果是因子格式。非常感谢任何帮助!
答案 0 :(得分:2)
检查您的数据,以查看各种预测因子和结果的分布情况。您可能会发现某些预测因子水平或结果水平非常高度偏差,或者某些结果或预测因子水平非常罕见。当我试图用经过大量调整的随机森林预测非常罕见的结果时,我得到了这个错误,因此一些预测器级别实际上并不在训练数据中。因此,在训练数据认为超出界限的测试数据中出现因子水平。