标签: random-forest feature-extraction feature-selection
在尝试应用随机森林之前,我尝试从20000多种原始特征(RNA-Seq表达数据)中提取一些特征。我可以使用公认的方法提取一些与某些生物学过程相对应的特征。但是,对于一个生物过程,没有好的方法可以为其提取特征。
我想知道是否应该尝试提取还是仅选择一些与整个提取的维度不匹配的原始特征,并且很可能单独贡献很少。
我认为这是一个权衡。这种情况下震颤会起作用吗?