作为我工作的一部分,我需要使用R评估时间序列数据的不同预测模型,并选择误差最小的模型。为此,我想知道如何使用线性回归(LR)方法来预测时间序列。在时间序列中,我们通常只有1列连续数据,但要使用LR,我们至少需要2个变量,如y = Beta0 + Beta1 * x。我有月度(x)的销售数字但是如何让y变量使用LR。
答案 0 :(得分:0)
Praveen,我认为我们并没有把重点放在这里。我知道你们正在尝试根据过去的数据来预测未来的销售情况。
假设您已使用data.frame
和sales
数据定义了revenue
time_period
。
此时,我会亲自进行一些数据探索,以检查变量之间是否存在某种相关性。
xyplot(revenue ~ time_period, data = sales)
然后,适合模型
sales_model = lm(revenue ~ time_period, data = sales)
现在建立模型并计算您要查找的系数。要获得它们,只需运行summary(sales_model)
系数矩阵的第一列应该给出模型的截距和斜率,它们是您正在寻找的 beta 。