机器学习 - 计算价值的重要性"在变量

时间:2015-07-01 11:21:00

标签: r variables machine-learning neural-network random-forest

我正在分析一个包含15个变量和150万个数据点的医疗数据集。 我想预测住院治疗,更重要的是预测哪种药物可能是负责任的。药物变量有大约700种药物。 有谁知道如何计算"价值的重要性" (在这种情况下,药物的类型)在一个用于加强的变量中? 我需要知道'药物A'是否比“药物B”更好用于预测,在一个名为“药物”的变量中 逻辑回归模型能够根据每种药物的p值给出这样的信息,但我想使用更复杂的方法。因为你可以为每种类型的药物创建一个二元变量,但这会产生700个额外的变量,但似乎效果不佳。我目前正在使用r。我真的希望你能帮我解决这个问题。提前致谢!亲切的问候彼得

1 个答案:

答案 0 :(得分:0)

请参阅库varImp()中的caret,它支持您引用的所有ML算法。