我想提取一个工作日索引,该索引每5天(工作日)重复一次。每月索引将提供每12个周期重复一次的12个索引值,而不是我想为工作周创建相同索引的几个月。我只有工作日频率(星期一至星期五)的时间序列数据。因此,每年我使用252作为频率。如果我分解此每日系列,则会按年份创建每日索引,该索引将为一年中的每个工作日创建一个索引。在Python / Statsmodels中,是否有一种方法可以从此时间序列创建索引,使我每5天可以获得相对索引值?
在分解时间序列之前,我先尝试更改重采样频率,然后尝试了各种分解方法,但我不知道如何执行此操作。下面的伪代码代表我两年的工作周数据。
import numpy as np
from scipy import stats
import pandas as pd
import statsmodels.tsa.api as tsa
import statsmodels.api as sm
vals = np.random.rand(504)
ts = pd.Series(vals)
df = pd.DataFrame(ts, columns=["Stock"])
df.index = pd.Index(pd.date_range("2012/01/01", periods = len(vals), freq = 'D'))
comp_Stock = tsa.seasonal_decompose(df, model='additive', freq = 252)
comp_Stock.seasonal[:5]
很难说出预期的结果,除了说comp_Stock之上的季节性指数会创建一个索引,该索引每252个值重复一次,使用相同的时间序列数据,我希望该索引每5天重复一次。最终目标是提取该索引作为预测的外生变量。