我试图在一组来自表达集(微阵列)的20000个基因上找到有用的特征选择方法,以获得仅具有有用基因的模型。 我尝试使用来自插入符号的RFE,但我有StackOverflow的错误,因为后向选择不支持n(预测变量)>的数据。 N(采样)。 有人可以建议一个合理的方法吗?或者这个RFE选择方法的解决方案?
提前致谢。
答案 0 :(得分:1)
您是否尝试使用遗传算法进行特征选择?有不同的包可以做到这一点 - GA,genalg,插入符号(在R中)。
看一下这篇博客,使用遗传算法进行的特征选择已经用例子进行了解释 - http://topepo.github.io/caret/GA.html
希望它有所帮助。