我有一个x轴数据集,该轴由[100-350]和y轴二进制0和1之间的值组成。
我使用sklearn logistic回归来找到最适合我的数据的logistic函数。
Dim pub As New ChromeDriver(service, opt)
pub.Navigate.GoToUrl("https://cdn01.muaban.net/mogi/thumb-detail/201810/01/951/5c055e8b0f88442a81ac5dfadc235e97.jpg")
pub.GetScreenshot.SaveAsFile("image.jpg")
当我简单地绘制点和所计算的模型时,我得到的结果似乎并不相关:
x_train,x_test,y_train,y_test = train_test_split(crowding[['time_spent_avg']].astype('timedelta64[m]'),crowding.over_crowd,test_size=0.01)
X=crowding.time_spent_avg.astype('timedelta64[m]')
X=X[:,np.newaxis]
y=crowding.over_crowd
model = LR( solver='lbfgs')
model.fit(X,y)
但是,当我检查模型的分数时:
loss = expit(X_test * model.coef_ + model.intercept_).ravel()
plt.figure()
plt.plot(X_test, loss, color='red', linewidth=3)
plt.plot(crowding.time_spent_avg.astype('timedelta64[m]'),crowding.over_crowd,'.')
我得到一个0.85的值,我认为这意味着模型运行良好。
这是否意味着模型很好?使用sklearn有什么问题吗?