我有一个pandas数据框,其中包含一个包含时间戳(start
)的列,另一列包含timedeltas(duration
)以指示持续时间。
我试图在时间戳上绘制一个条形图,显示这些持续时间的左边缘。无论如何我还没有在网上找到它。有没有办法实现这个目标?
到目前为止,这就是我所拥有的,但它不起作用:
height = np.ones(df.shape[0])
width = [x for x in df['duration']]
plt.bar(left=df['start'], height=height, width=width)
修改 我更新了宽度如下,但也没有解决这个问题:
width = [x.total_seconds()/(60*1200) for x in df['duration']]
我有兴趣知道datetime.timedelta
对象是否可以在width
中使用,因为datetime
个对象可以用作x轴。如果没有,有什么替代品?
编辑#2:
这可能不是我问题的确切答案,但它解决了我的目的。对于任何感兴趣的人,这是我最终采用的方法(我使用start
和duration
为此目的制作end
:
for i in range(df.shape[0]):
plt.axvspan(df.ix[i, 'start'], df.ix[i, 'end'], facecolor='g', alpha=0.3)
plt.axvline(x=df.ix[i, 'start'], ymin=0.0, ymax=1.0, color='r', linewidth=1)
plt.axvline(x=df.ix[i, 'end'], ymin=0.0, ymax=1.0, color='r', linewidth=1)
答案 0 :(得分:3)
如果您df.duration[0]
的类型为pandas.tslib.Timedelta
且您的timestamps
相隔数日,则可以使用:
width = [x.days for x in df.duration]
这将产生图表。
否则请使用this answer
中列出的total_seconds
方法
更新:
如果数据是以小时为单位的timedeltas,那么获得图表的方法就是这样:
import datetime as dt
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
dates = pd.date_range(start=dt.date(2014,10,22), periods=10, freq='H')
df = pd.DataFrame({'start': dates, 'duration': np.random.randint(1, 10, len(dates))},
columns=['start', 'duration'])
df['duration'] = df.duration.map(lambda x: pd.datetools.timedelta(0, 0, 0, 0, x))
df.ix[1, 1] = pd.datetools.timedelta(0, 0, 0, 0, 30) # To clearly see the effect at 01:00:00
width=[x.minutes/24.0/60.0 for x in df.duration] # mpl will treat x.minutes as days hense /24/60.
plt.bar(left=df.start, width=width, height=[1]*df.start.shape[0])
ax = plt.gca()
_ = plt.setp(ax.get_xticklabels(), rotation=45)
这会生成如下图表: