我有下一个问题。
我在sas中创建了一个包含200个变量的随机森林。
现在我想用相同的模型对新的观察进行评分,但我只有50个变量(重要的变量!)。
当我运行分数时,它会崩溃并出现下一条消息: 错误:在数据集中找不到分数输入变量var_1。 (那没关系,因为我不会再次生成这些变量,它们没用)。
问题是,如何只使用50个变量运行模型?
谢谢,
答案 0 :(得分:0)
您可能只想使用选定的50个变量重新运行RF模型。你走在正确的道路上。你只是没有使用50个选定的变量进行第二次。该错误意味着保存的二进制分数文件仍保留第一个模型列。