根据DatetimeIndex变量对熊猫数据框重新采样

时间:2020-04-12 19:39:32

标签: python pandas dataframe resampling

我有一个带有日期索引的数据框:

           Symbol  Shares  Price  Commission
Date                                        
2017-12-06    BNP       0      0        10.0
2018-10-09    BNP       0      0        10.0

和单独的DatetimeIndex变量:

DatetimeIndex(['2014-02-14', '2014-02-15', '2014-02-16', '2014-02-17',
               ...
               '2020-04-11', '2020-04-12'],
              dtype='datetime64[ns]', length=2250, freq='D')

我正在尝试根据该变量对数据框进行重新采样。有什么办法吗?我了解pandas.DataFrame.resample,但似乎只能用于“常规”重采样(即每天,每周等)

我是python的新手,是从MATLAB迁移的。

谢谢!

1 个答案:

答案 0 :(得分:0)

这取决于您要执行的操作,请检查: http://pandas-docs.github.io/pandas-docs-travis/user_guide/timeseries.html

但是,Series和DataFrame也可以直接支持时间 组件本身就是数据。

我仅举一些例子:

rng = pd.date_range('1/1/2012', periods=100, freq='S')
ts = pd.Series(np.random.randint(0, 500, len(rng)), index=rng)
ts.resample('W-MON')

idx = pd.date_range('2018-01-01', periods=5, freq='H')
ts = pd.Series(range(len(idx)), index=idx)
Output: 
2018-01-01 00:00:00    0
2018-01-01 01:00:00    1
2018-01-01 02:00:00    2
2018-01-01 03:00:00    3
2018-01-01 04:00:00    4

pd.Series(range(3), index=pd.date_range('2000', freq='D', periods=3))
Output: 
2000-01-01    0
2000-01-02    1
2000-01-03    2

pd.Series(pd.period_range('1/1/2011', freq='M', periods=3))
Output: 
0   2000-01-01
1   2000-01-02
2   2000-01-03