背景:
我使用 scikit-learn 处理一个关于多类分类问题的项目。 我的数据集包含 40 个测量对象 (MO) 中每个对象的 112 个特征向量。总共 4480 个特征向量,平均分为 4 个类,533 个特征。 (有关 the data set 的更多信息,请点击此处)
方法:
在拆分数据集(train:34 MO, test:6 MO)并减少特征数量后,主要通过 PCA,我使用 gridsearchcv 对不同模型使用 KFold 调整超参数以进行比较。
问题:
答案 0 :(得分:0)
@4.Pi.n 的评论解决了我的问题:
<块引用>y_pred = (pred_1 + pred_2 + ... + pred_k) / k
,或
你可以使用 sklearn.model_selection.cross_val_predict