我正在尝试使用ARIMA和外部变量进行一些时间序列分析,以预测犯罪趋势,但是我遇到了一个问题。我只有周末的约会,所以我的频率基本上是每周两次索引输入,而且我一生无法弄清楚如何设置频率...任何想法?
例如,我可以制作一个没有问题的每日时间
PeriodIndex(['2017-02-12', '2017-04-12', '2017-09-12', '2017-12-31',
'2018-01-01', '2018-05-01', '2018-06-01', '2018-10-01',
'2018-01-20', '2018-01-22',
...
'2018-07-22', '2018-07-23', '2018-07-24', '2018-07-25',
'2018-07-26', '2018-07-27', '2018-07-28', '2018-07-29',
'2018-07-30', '2018-07-31'],
dtype='period[D]', name='Row Labels', length=196, freq='D')
但是,由于我只想研究一个周末效应,所以我只想关注Sarturday和Sunday,因此我可以使用一些时间序列回归来检验该序列。我可以通过删除变量并只关注两个变量之一来实现它。
DatetimeIndex(['2018-01-27', '2018-02-03', '2018-02-10', '2018-02-17',
'2018-02-24', '2018-03-03', '2018-03-10', '2018-03-17',
'2018-03-24', '2018-03-31', '2018-04-07', '2018-04-14',
'2018-04-21', '2018-04-28', '2018-05-05', '2018-05-12',
'2018-05-19', '2018-05-26', '2018-06-02', '2018-06-09',
'2018-06-16', '2018-06-23', '2018-06-30', '2018-07-07',
'2018-07-14', '2018-07-21', '2018-07-28', '2018-08-04'],
dtype='datetime64[ns]', name='Row Labels', freq='W-SAT')
但是我怎么在周六和周日得到它?
答案 0 :(得分:0)
我将重新采样到每日频率,然后使用
weekend_only = df[df.index.weekday >= 5]
其中df
是带有pandas.DataFrame
的{{1}}。
对于DateTimeIndex
属性,0-4是周一至周五,周六至周日为5-6。
有关更多信息,请参见pandas user guide on Time Series。