这是我没有交叉验证的原始代码。
model = LogisticRegression()
model = model.fit(matrix_tmp, label_tmp)
print("Entered 1")
y_train_pred = model.predict(matrix_tmp_test)
这里matrix_tmp,label_tmp和matrix_tmp_test是矩阵。 我希望在这里使用K折叠交叉验证。
model = SGDClassifier()
cv=cross_validation.KFold(len(matrix_tmp), n_folds=5)
results=[]
for traincv, testcv in cv:
model = model.fit(matrix_tmp[traincv], label_tmp[traincv]).predict(matrix_tmp_test[testcv])
results.append( Error_function)
print "Results:" + str(np.array(results).mean())
这似乎不起作用。我这样做了吗?
答案 0 :(得分:0)
很抱歉,如果没有具体的例子,我无法提供有价值的建议。但是,我认为您可以尝试使用cross_validation.train_test_split,它可以更有意义,更少有机会出错。