R-机器学习:分类响应变量的子集选择包和方法

时间:2019-05-28 20:59:40

标签: r machine-learning regression feature-selection

我有一个临床数据集,包含大约26个变量(包括数值变量和分类变量),包括响应变量。

分类响应变量“ RETINOPATHY”具有两个因子级别:“是”和“否”。

现在,任务是从26个总数中找到一个最佳特征变量以预测分类响应变量。验证不同子集的 AIC (Akaike)等值

我发现名为“ leaps”的库非常适合此任务,但仅当响应变量为 Numerical 时才有效。 “ regsubsets”不适用于分类变量,因为它基于线性回归。见下文:

regsubsets(finalDataDF$RETINOPATHY~., data = finalDataDF, nbest = 5, method="exhaustive")

在以上示例中,RETINOPATHY是类别响应变量,它是其余变量的函数。

我进行了很多搜索,但无法获得正确的解释,例如可以使用哪个R包来获得用于预测视网膜病变的特征子集。

请进一步指导我。预先感谢。

0 个答案:

没有答案