我有一个临床数据集,包含大约26个变量(包括数值变量和分类变量),包括响应变量。
分类响应变量“ RETINOPATHY”具有两个因子级别:“是”和“否”。
现在,任务是从26个总数中找到一个最佳特征变量以预测分类响应变量。验证不同子集的 AIC (Akaike)等值
我发现名为“ leaps”的库非常适合此任务,但仅当响应变量为 Numerical 时才有效。 “ regsubsets”不适用于分类变量,因为它基于线性回归。见下文:
regsubsets(finalDataDF$RETINOPATHY~., data = finalDataDF, nbest = 5, method="exhaustive")
在以上示例中,RETINOPATHY是类别响应变量,它是其余变量的函数。
我进行了很多搜索,但无法获得正确的解释,例如可以使用哪个R包来获得用于预测视网膜病变的特征子集。
请进一步指导我。预先感谢。