每年划分时间序列进行绘图

时间:2020-02-09 19:56:59

标签: python-3.x pandas time-series

我想绘制一个时间序列,从2015年10月开始到2018年2月结束,在一张图中,每年都是一条直线。时间序列是int64的值,在Pandas DataFrame中。日期在datetime64[ns]中作为DataFrame中的列之一。

我将如何从Jan-Dez创建一个每年有4条线的图表。

使用

graph ['share_price']和graph ['date']。我尝试过Grouper,但是以某种方式采用了2015年10月的值并将其与所有其他年份的1月的值混合。

这个groupby接近我想要的,但是我丢失了列表索引属于哪一年的信息。

graph.groupby('date').agg({'share_price':lambda x: list(x)})

然后我创建了一个包含4列的DataFrame,每年有1列,但是我仍然不知道如何继续对这4列进行分组,这样我就可以以某种方式绘制图形我想要。

1 个答案:

答案 0 :(得分:2)

您可以通过以下方式实现此目标:

  1. 从日期中提取年份
  2. 用等价的日期代替日期,而不用年份
  3. 将年份和日期都设置为索引
  4. 按年份分拆值

此时,每年将是一列,而一年中的每个日期将是一行,因此您可以正常绘制。

这是一个例子。

假设您的DataFrame看起来像这样:

>>> import pandas as pd
>>> import numpy as np
>>> index = pd.date_range('2015-10-01', '2018-02-28')
>>> values = np.random.randint(-3, 4, len(index)).cumsum()
>>> df = pd.DataFrame({
...    'date': index,
...    'share_price': values
>>> })
>>> df.head()
        date  share_price
0 2015-10-01            0
1 2015-10-02            3
2 2015-10-03            2
3 2015-10-04            5
4 2015-10-05            4
>>> df.set_index('date').plot()

enter image description here

您将按照以下方式转换DataFrame:

>>> df['year'] = df.date.dt.year
>>> df['date'] = df.date.dt.strftime('%m-%d')
>>> unstacked = df.set_index(['year', 'date']).share_price.unstack(-2)
>>> unstacked.head()
year   2015  2016  2017  2018
date                         
01-01   NaN  28.0 -16.0  21.0
01-02   NaN  29.0 -14.0  22.0
01-03   NaN  29.0 -16.0  22.0
01-04   NaN  26.0 -15.0  23.0
01-05   NaN  25.0 -16.0  21.0

然后正常绘制:

unstacked.plot()

enter image description here