Question

我正在使用R中预测包中的auto.arima来确定傅立叶级数的最佳K项。

执行完此操作之后，我想计算季节并将该季节变量插入多元回归模型。

使用预测包中的数据集，我能够提取最佳数量的傅立叶项：

library(forecast)

##Public dataset from the forecast package
head(gas)

##Choose Optimal Amount of K-Terms
bestfit <- list(aicc=Inf)
for(i in 1:6)
{
  fit <- auto.arima(gas, xreg=fourier(gas, K=i), seasonal=FALSE)
  if(fit$aicc < bestfit$aicc)
    bestfit <- fit
  else break;
  optimal_k_value<-max(i)
  print(i)
}

##Extract Fourier Terms 
seasonality<-data.frame(fourier(gas, K=optimal_k_value))

##Convert Gas TS Data to Dataframe
gas_df <- data.frame(gas, year = trunc(time(gas)), 
                 month = month.abb[cycle(gas)])

##Extract True Seasonality by Taking Sum of Rows
seasonality$total<- rowSums(seasonality)

##Combine Seasonality to Month and Year
final_df<-cbind(gas_df, seasonality$total)

在以后的建模中，“ seasonality$total”列是否应被“季节性变量”考虑？还是需要在其中添加系数？

Answer 1

否，X | 2 Y | 2 Z | 3不是季节性变量。要看到这一点，请注意seasonality$total的每一列都是从-1到1的季节性分量，因此它们只是sin（...）和cos（...），没有任何系数。显然，不同的季节成分必须具有不同的系数，因此您不应该将它们相加。

旁注1 ：由于fourier(gas, K = optimal_k_value)始终只是一个数字，因此使用i毫无意义，只需max(i)就可以了。

旁注2 ：我建议检查

optimal_k_value <- i

其中一个可能是季节性比年度频率低（看来plot(resid(auto.arima(gas, xreg = fourier(gas, K = optimal_k_value), seasonal = FALSE)))不允许考虑这一点），尽管您可能会将其单独建模为趋势。另外，将数据拆分为1970年之前和之后的数据可能是个好主意。

了解傅立叶的季节性

1 个答案: