线性回归返回不合适的大x值

时间:2019-05-21 11:04:15

标签: linear-regression

我正在寻找一个线性回归,以确定特定资源的估计枯竭日期。我有一个数据集,其中包含一列日期和几列数据,并且一直在减少。使用scikit learning的LinearRegression()函数进行线性回归会产生不合适的结果。

我将日期列转换为序数,结果值为〜700,000。相对于y轴值(介于0-200之间),这是相当大的。我认为回归函数从低值开始并逐步提高,最终在找到合适的值之前就放弃了。如果我可以为参数分配起始值,较大的截距和较小的斜率,那么也许可以解决该问题。我不知道该怎么做,我对其他解决方案也很好奇。

这里是一些数据的链接- https://pastebin.com/BKpeZGmN

这是我当前的代码

model=LinearRegression().fit(dates,y)
model.score(dates,y)

y_pred=model.predict(dates)

plt.scatter(dates,y)
plt.plot(dates,y_pred,color='red')
plt.show()

print(model.intercept_)
print(model.coef_) 

此代码在数据上绘制线性模型,从而产生惊人的误差。我会在这篇文章中分享,但是我不确定如何从桌面发布图像。

我的原始数据是日期,我在这里未共享的代码中转换为序数。如果有一种更简单的方法可以更准确地做到这一点,我将不胜感激。

谢谢, 会

0 个答案:

没有答案