我正在使用R中预测包中的auto.arima来确定傅立叶级数的最佳K项。
执行完此操作之后,我想计算季节并将该季节变量插入多元回归模型。
使用预测包中的数据集,我能够提取最佳数量的傅立叶项:
library(forecast)
##Public dataset from the forecast package
head(gas)
##Choose Optimal Amount of K-Terms
bestfit <- list(aicc=Inf)
for(i in 1:6)
{
fit <- auto.arima(gas, xreg=fourier(gas, K=i), seasonal=FALSE)
if(fit$aicc < bestfit$aicc)
bestfit <- fit
else break;
optimal_k_value<-max(i)
print(i)
}
##Extract Fourier Terms
seasonality<-data.frame(fourier(gas, K=optimal_k_value))
##Convert Gas TS Data to Dataframe
gas_df <- data.frame(gas, year = trunc(time(gas)),
month = month.abb[cycle(gas)])
##Extract True Seasonality by Taking Sum of Rows
seasonality$total<- rowSums(seasonality)
##Combine Seasonality to Month and Year
final_df<-cbind(gas_df, seasonality$total)
在以后的建模中,“ seasonality$total
”列是否应被“季节性变量”考虑?还是需要在其中添加系数?
答案 0 :(得分:1)
否,X | 2
Y | 2
Z | 3
不是季节性变量。要看到这一点,请注意seasonality$total
的每一列都是从-1到1的季节性分量,因此它们只是sin(...)和cos(...),没有任何系数。显然,不同的季节成分必须具有不同的系数,因此您不应该将它们相加。
旁注1 :由于fourier(gas, K = optimal_k_value)
始终只是一个数字,因此使用i
毫无意义,只需max(i)
就可以了。>
旁注2 :我建议检查
optimal_k_value <- i
其中一个可能是季节性比年度频率低(看来plot(resid(auto.arima(gas, xreg = fourier(gas, K = optimal_k_value), seasonal = FALSE)))
不允许考虑这一点),尽管您可能会将其单独建模为趋势。另外,将数据拆分为1970年之前和之后的数据可能是个好主意。