我不太清楚cross_val_predict是如何工作的。我假设该函数会自动创建多个折叠测试集,然后提供的输出将是整个数据集的样本外预测。例如,对于具有5折的数据集,数据的前20%将用作测试,而其余80%将用于训练。然后,对于接下来的20%数据,其余80%的数据将再次用于训练等。
但是,在sklearn文档中显示为:
https://scikit-learn.org/stable/modules/generated/sklearn.model_selection.cross_val_predict.html
“将这些预测传递到评估指标中是不合适的。使用cross_validate来度量泛化误差。”
我当时以为这正是该被使用的目的。有人可以解释我是否错了吗?