我正在寻找一个线性回归,以确定特定资源的估计枯竭日期。我有一个数据集,其中包含一列日期和几列数据,并且一直在减少。使用scikit learning的LinearRegression()函数进行线性回归会产生不合适的结果。
我将日期列转换为序数,结果值为〜700,000。相对于y轴值(介于0-200之间),这是相当大的。我认为回归函数从低值开始并逐步提高,最终在找到合适的值之前就放弃了。如果我可以为参数分配起始值,较大的截距和较小的斜率,那么也许可以解决该问题。我不知道该怎么做,我对其他解决方案也很好奇。
这里是一些数据的链接- https://pastebin.com/BKpeZGmN
这是我当前的代码
model=LinearRegression().fit(dates,y)
model.score(dates,y)
y_pred=model.predict(dates)
plt.scatter(dates,y)
plt.plot(dates,y_pred,color='red')
plt.show()
print(model.intercept_)
print(model.coef_)
此代码在数据上绘制线性模型,从而产生惊人的误差。我会在这篇文章中分享,但是我不确定如何从桌面发布图像。
我的原始数据是日期,我在这里未共享的代码中转换为序数。如果有一种更简单的方法可以更准确地做到这一点,我将不胜感激。
谢谢, 会