数据集有一个时间戳和水流值,现在我想对数据建模,以便如果出现任何异常值(突然的峰值或非常低的值),它应该发送一条错误消息通知。由于它是时间序列,因此我尝试使用ARIMA模型来训练数据,但它不会产生相关结果,这意味着我做错了事。所以请指导我。谢谢。数据集的链接为:https://drive.google.com/open?id=1cFHSVpY0XBxsEayl2k1cK4_qWZ4PvDBd
from sklearn.linear_model import LinearRegression
features = [col for col in x2.columns if 'day' in col]
X = x2['median'].reshape(-1,1)
y = x2['time']
# create linear regression object
reg = linear_model.LinearRegression()
# train the model using the training sets
reg.fit(X, y)
# regression coefficients
print('Coefficients: \n', reg.coef_)
我尝试将每个时间间隔的所有水流量值的中位数用作目标变量,但它也会产生负方差得分。
预期结果应该是给定时间的水流量值,该值表明水流量是否在正常范围内。
答案 0 :(得分:0)
由于这个问题似乎是单一问题,所以我建议从绘制关于时间的中位数水流量开始。绘图的形状将告诉您如何最好地对问题建模。