我想绘制一个时间序列,从2015年10月开始到2018年2月结束,在一张图中,每年都是一条直线。时间序列是int64
的值,在Pandas DataFrame
中。日期在datetime64[ns]
中作为DataFrame中的列之一。
我将如何从Jan-Dez创建一个每年有4条线的图表。
使用 graph ['share_price']和graph ['date']。我尝试过Grouper
,但是以某种方式采用了2015年10月的值并将其与所有其他年份的1月的值混合。
这个groupby接近我想要的,但是我丢失了列表索引属于哪一年的信息。
graph.groupby('date').agg({'share_price':lambda x: list(x)})
然后我创建了一个包含4列的DataFrame,每年有1列,但是我仍然不知道如何继续对这4列进行分组,这样我就可以以某种方式绘制图形我想要。
答案 0 :(得分:2)
您可以通过以下方式实现此目标:
此时,每年将是一列,而一年中的每个日期将是一行,因此您可以正常绘制。
这是一个例子。
假设您的DataFrame看起来像这样:
>>> import pandas as pd
>>> import numpy as np
>>> index = pd.date_range('2015-10-01', '2018-02-28')
>>> values = np.random.randint(-3, 4, len(index)).cumsum()
>>> df = pd.DataFrame({
... 'date': index,
... 'share_price': values
>>> })
>>> df.head()
date share_price
0 2015-10-01 0
1 2015-10-02 3
2 2015-10-03 2
3 2015-10-04 5
4 2015-10-05 4
>>> df.set_index('date').plot()
您将按照以下方式转换DataFrame:
>>> df['year'] = df.date.dt.year
>>> df['date'] = df.date.dt.strftime('%m-%d')
>>> unstacked = df.set_index(['year', 'date']).share_price.unstack(-2)
>>> unstacked.head()
year 2015 2016 2017 2018
date
01-01 NaN 28.0 -16.0 21.0
01-02 NaN 29.0 -14.0 22.0
01-03 NaN 29.0 -16.0 22.0
01-04 NaN 26.0 -15.0 23.0
01-05 NaN 25.0 -16.0 21.0
然后正常绘制:
unstacked.plot()