sklearn cross_val_predict用于样本外评估

时间:2019-02-25 16:23:23

标签: scikit-learn cross-validation sklearn-pandas

我不太清楚cross_val_predict是如何工作的。我假设该函数会自动创建多个折叠测试集,然后提供的输出将是整个数据集的样本外预测。例如,对于具有5折的数据集,数据的前20%将用作测试,而其余80%将用于训练。然后,对于接下来的20%数据,其余80%的数据将再次用于训练等。

但是,在sklearn文档中显示为:

https://scikit-learn.org/stable/modules/generated/sklearn.model_selection.cross_val_predict.html

“将这些预测传递到评估指标中是不合适的。使用cross_validate来度量泛化误差。”

我当时以为这正是该被使用的目的。有人可以解释我是否错了吗?

0 个答案:

没有答案