基于AUC的R随机森林特征选择

时间:2015-11-23 15:49:46

标签: r random-forest feature-selection

对于二元期权预测(上升,下跌)我在R中尝试随机森林,但重要性度量和OOB在我的情况下有偏见

我找到this article,但它与Python有关。

是否有自动特征选择的R包方法

  • 基于AUC
  • 也许允许我定义自己的评估功能(赚取的钱是召回和准确率的函数)
  • 也许允许我指定交叉验证方法:随机选择跟踪和测试用例是有偏见的,因为有时间序列数据,其中测试数据必须晚于训练数据

1 个答案:

答案 0 :(得分:1)

我刚刚遇到这个问题,我发现这个包可能对你有帮助:

我。它被称为AUCRF,它在基于优化AUC的随机森林模型中执行特征选择。 https://cran.r-project.org/web/packages/AUCRF/AUCRF.pdf

II。它确实允许基于AUC的选择的交叉验证     AUCRFcv(x,nCV = 5,M = 20)

其中nCV是折叠数,M =重复次数。

III。关于允许自己的评估,它确实有一个选项,您可以使用〜指定公式,但是您必须针对特定情况进行更多探索,因为您没有提供测试代码。

希望这有帮助!