使用日期时间索引采样在那些日期时间选择熊猫数据框中的特征(行)

时间:2018-08-04 21:39:50

标签: python pandas dataframe time-series

我有一个datetime索引对象,该对象由我正在训练学习者的LARGE数据框中的随机采样数据的索引值组成。我想使用日期时间索引,例如

DatetimeIndex(['1911-11-18', '2015-05-02', '1934-08-15', '1950-09-16',
               '1944-06-01', '2004-07-30', '1947-11-18', '1977-07-08',
               '1945-05-31', '1944-01-31',
               ...
               '1884-06-24', '1999-11-22', '1960-02-02', '1883-03-08',
               '1952-11-19', '1993-02-04', '1965-04-26', '1885-09-30',
               '1890-02-26', '2008-03-28'],
              dtype='datetime64[ns]', length=300000, freq=None)
在每个训练示例的

中返回到完整的数据框并查找当日的目标值,然后从该日期算起未来1年用作实际目标。

总体环境是训练来自时间序列数据的随机样本,并在将来确定目标值。

我的大数据框架称为toLearn。我正在其上训练的示例数据框称为dataSlice(toLearn的子集)。

1 个答案:

答案 0 :(得分:0)

类似于以下内容,可以满足我的尝试。

 # Find Target 7 years after Each Training Sample 

indicesOfTrainSamples=trainSamples.index
indicesOfTarget=indicesOfTrainSamples + pd.Timedelta(weeks=7*52)

targets=[]
for i in indicesOfTarget:
     targets.append(toLearn.loc[i])

targetSlices=pd.DataFrame(targets,index=indicesOfTarget)
targetFeature=targetSlices['targetValues']