没有交叉验证的学习曲线

时间:2021-05-13 08:43:00

标签: python machine-learning

我有一个 svm 模型,我用来确定患者是否患有 malignantbenign 癌症。

dataset = datasets.load_breast_cancer() 
X_train, X_test, y_train, y_test = train_test_split(dataset.data, dataset.target, test_size=0.20,random_state=109) 
model = SVC(kernel='linear', C=1)
model.fit(X_train, y_train)
y_pred = model.predict(X_test)

要检查我的模型是过拟合还是欠拟合,我想绘制学习曲线。
https://scikit-learn.org/stable/modules/learning_curve.html
我在这里不明白的是交叉验证部分。
在他们给出的文档示例中:

train_sizes, train_scores, valid_scores = learning_curve(model, X, y, train_sizes=[50, 80, 110], cv=5)

他们对 X,y 标签执行 5 折交叉验证。所以他们以我拆分数据的不同方式拆分数据。如何在没有交叉验证的情况下绘制曲线?我的问题是我想确定模型是过拟合、欠拟合还是正确。

0 个答案:

没有答案