Scikit学习交叉验证分裂

时间:2015-05-24 11:46:15

标签: python scikit-learn classification cross-validation

我目前正在使用 cross_validation.cross_val_predict 来获取LogisticRegression分类器所做的预测。我的问题是:培训集中有多少百分比的数据以及构成测试集的百分比是多少?这是80%-20%的分裂吗?

我在stackoverflow上检查了网站和其他问题,但没有找到我的问题的答案。

1 个答案:

答案 0 :(得分:1)

documentation for this function中,它指出了cv arg:

  

cv:交叉验证生成器或int,可选,默认值:无   要使用的交叉验证生成器。如果是int,则确定StratifiedKFold中的折叠数,如果y是二进制或多类,估计器是分类器,否则确定折叠数以KFold表示。如果为None,则相当于cv = 3。此生成器必须包含测试集中的所有元素一次。否则,会引发ValueError。