我正在尝试绘制300万个训练数据的sklearn learning_curve
,其中LGBMClassifier
是估计量。但是当我绘制learning_Curve
时,仅显示到200万条记录。
请在下面找到我的代码:
train_sizes, train_scores, validation_scores = learning_curve(
estimator = lgb_estimator,
X = train,
y = target, train_sizes = np.linspace(0.1,1,5), cv = 3,
scoring = 'roc_auc')
plt.style.use('seaborn')
plt.plot(train_sizes, train_scores_mean, label = 'Training error')
plt.plot(train_sizes, validation_scores_mean, label = 'Validation error')
plt.ylabel('MSE', fontsize = 14)
plt.xlabel('Training set size', fontsize = 14)
plt.title('Learning curves for a linear regression model', fontsize = 18, y = 1.03)
plt.legend()
plt.ylim(0.1,1)
请直到这是一种预期的行为,否则我们可以通过sklearn learning_curve
绘制任意数量的记录。请让我知道该代码将绘制具有任意数量记录的学习曲线
答案 0 :(得分:0)
您是否尝试过设置xlim
plt.xlim(0,3000000)