我有一个关于scikit的新问题。
分类问题,逻辑回归作为估计量。 我有我的X数据集,带有我的功能。
我想通过交叉验证使用我的算法,我有两种方法:我在5个子集中手动分割我的数据集,最后我迭代5次,每次都有一个不同的测试集。我获得了我的分数,但我现在想要的是与估算器一起用于预测新数据集的系数的平均值。我在stackoverflow上的某处读到可以将系数传递给scikit逻辑回归估计器。
另一种方法是使用cross_val_score
:
lrmodel=LogisticRegression(penalty='l2',C=1)
cv.cross_val_score(lrmodel, Xf, y, cv=5,scoring='log_loss', verbose=0)
在交叉验证估计之后,给出了交叉熵。但是,如果现在我想使用平均系数并使用估算器对我新的未标记数据集进行新预测呢?
谢谢!