回归模型/非线性回归

时间:2019-05-23 07:33:54

标签: python machine-learning time-series arima non-linear-regression

数据集有一个时间戳和水流值,现在我想对数据建模,以便如果出现任何异常值(突然的峰值或非常低的值),它应该发送一条错误消息通知。由于它是时间序列,因此我尝试使用ARIMA模型来训练数据,但它不会产生相关结果,这意味着我做错了事。所以请指导我。谢谢。数据集的链接为:https://drive.google.com/open?id=1cFHSVpY0XBxsEayl2k1cK4_qWZ4PvDBd

from sklearn.linear_model import LinearRegression
features = [col for col in x2.columns if 'day' in col]
X = x2['median'].reshape(-1,1)
y = x2['time']
# create linear regression object 
reg = linear_model.LinearRegression()
# train the model using the training sets 
reg.fit(X, y) 
# regression coefficients 
print('Coefficients: \n', reg.coef_) 

我尝试将每个时间间隔的所有水流量值的中位数用作目标变量,但它也会产生负方差得分。

预期结果应该是给定时间的水流量值,该值表明水流量是否在正常范围内。

1 个答案:

答案 0 :(得分:0)

由于这个问题似乎是单一问题,所以我建议从绘制关于时间的中位数水流量开始。绘图的形状将告诉您如何最好地对问题建模。