Question

这是我没有交叉验证的原始代码。

model = LogisticRegression()
model = model.fit(matrix_tmp, label_tmp)
print("Entered 1")
y_train_pred = model.predict(matrix_tmp_test)

这里matrix_tmp，label_tmp和matrix_tmp_test是矩阵。我希望在这里使用K折叠交叉验证。

model = SGDClassifier()
cv=cross_validation.KFold(len(matrix_tmp), n_folds=5)
results=[]

for traincv, testcv in cv:
   model = model.fit(matrix_tmp[traincv],   label_tmp[traincv]).predict(matrix_tmp_test[testcv])
   results.append( Error_function)
print "Results:" + str(np.array(results).mean())

这似乎不起作用。我这样做了吗？

Answer 1

很抱歉，如果没有具体的例子，我无法提供有价值的建议。但是，我认为您可以尝试使用cross_validation.train_test_split，它可以更有意义，更少有机会出错。

K用矩阵折叠交叉验证

1 个答案: