sklearn中的极大似然估计

时间:2017-05-01 16:13:08

标签: machine-learning scikit-learn mle

在我的项目中,我使用GridSearchCV中的sklearn来详尽搜索模型的指定参数值,以找到最佳参数值。我只是在RandomForestClassifier中测试它,并帮助我找到最好的max_depthn_estimators。基于此,我有两个问题:

  1. GridSearchCV是否在引擎盖下使用最大似然估计(MLE)的概念?
  2. 我是否可以使用一种技术为我的数据集选择最佳模型,而不是对每个模型使用GridSearchCV?我认为这是模型选择的概念,但我不知道如何通过sklearn使用它。
  3. 谢谢

1 个答案:

答案 0 :(得分:3)

  

GridSearchCV是否在引擎盖下使用最大似然估计(MLE)的概念?

MLE是概率推理,因此它只能应用于概率模型。 GridSearchCV不是基于MLE的,基于直接估计测试误差进行模型选择是一个简单的技巧。所以给定一个特定的模型,它可以指定一个代表它有多好的数字 - 给定很多模型,你可以简单地选择数量最多的那个(最高估计综合实力)。

  

有没有一种技术可以用来为我的数据集选择最佳模型,而不是对每个模型使用GridSearchCV?我认为这是模型选择的概念,但我不知道如何通过sklearn使用它。

有很多,但是sklearn几乎只实现了各种列车测试分离器(CV,随机等);相反,您可能想要考虑其他支持的库:

  • 贝叶斯优化
  • Parzen Estimators树技术

哪种是寻找优质超级参数的更高级方法(而不仅仅是检查现有的超级参数)。