我有一个datetime索引对象,该对象由我正在训练学习者的LARGE数据框中的随机采样数据的索引值组成。我想使用日期时间索引,例如
DatetimeIndex(['1911-11-18', '2015-05-02', '1934-08-15', '1950-09-16',
'1944-06-01', '2004-07-30', '1947-11-18', '1977-07-08',
'1945-05-31', '1944-01-31',
...
'1884-06-24', '1999-11-22', '1960-02-02', '1883-03-08',
'1952-11-19', '1993-02-04', '1965-04-26', '1885-09-30',
'1890-02-26', '2008-03-28'],
dtype='datetime64[ns]', length=300000, freq=None)
在每个训练示例的中返回到完整的数据框并查找当日的目标值,然后从该日期算起未来1年用作实际目标。
总体环境是训练来自时间序列数据的随机样本,并在将来确定目标值。
我的大数据框架称为toLearn。我正在其上训练的示例数据框称为dataSlice(toLearn的子集)。
答案 0 :(得分:0)
类似于以下内容,可以满足我的尝试。
# Find Target 7 years after Each Training Sample
indicesOfTrainSamples=trainSamples.index
indicesOfTarget=indicesOfTrainSamples + pd.Timedelta(weeks=7*52)
targets=[]
for i in indicesOfTarget:
targets.append(toLearn.loc[i])
targetSlices=pd.DataFrame(targets,index=indicesOfTarget)
targetFeature=targetSlices['targetValues']