将训练结果汇总到预测

时间:2018-03-13 17:29:59

标签: python-3.x scikit-learn cross-validation

训练模型时,结果取决于采样。为了获得更好的东西,你可以重复训练(在另一个随机创建训练样本中,使用FfoldsStratifiedKFold ...),以某种方式聚合结果并以这种方式得到更多的结果仅在特定情况下创建的强大。 问题:它是否已在sklearn或类似内容中实现?。道歉是一个直截了当的问题,我没有看到一个简单的解决方案。

我看到有一个名为cross_val_predict的函数但是我对源代码的快速查看的第一个印象是它预先列出了火车的次数,我想只预测它们,所以我可以piclke以某种方式汇总结果,并在以后预测,而不是再次重复整个训练。

1 个答案:

答案 0 :(得分:0)

到目前为止,我认为最好的选择是ensemblers in sklearn

我离开这里之前使用过的解决方案。我很确定可以改进(如Ensemblers in sklearn之前所述)更好。我已经放置了https://github.com/rafaelvalero/aggreating_predictions_sklearn,我已经留下了笔记本和示例(使用虹膜数据库),以防任何人可以玩游戏并详细了解如何完成。

该解决方案将训练模型(并行地,使用joblib),挑选训练的模型(来自SKlearn的模型),存储结果(使用joblib转储),然后将恢复它们以创建预测(并行地,使用joblib)以后是聚合的。