如何使用sklearn GroupKfold处理类不平衡?

时间:2017-01-20 01:27:56

标签: python scikit-learn cross-validation

Sklearn有StratifiedKFold,但似乎没有对GroupKFold进行分层。是否有人为分组数据中的类不平衡提供了良好的工作流程?

2 个答案:

答案 0 :(得分:1)

sklearn项目尚未在其主分支中包含分层的GroupKFold。 但是,有一个特定的分支等待合并到master分支以包含此确切功能。

您可以在以下链接中找到分支: https://github.com/scikit-learn/scikit-learn/pull/9413

答案 1 :(得分:-1)

Sklearn拥有GroupKFlod http://scikit-learn.org/stable/modules/generated/sklearn.model_selection.GroupKFold.html。 它可以帮助您创建自己的类。