我有一个带有一些时间序列数据的csv文件。我这样创建一个数据框:
df = pd.read_csv('C:\\Desktop\\Scripts\\TimeSeries.log')
当我致电df.head(6)
时,数据显示如下:
Company Date Value
ABC 08/21/16 00:00:00 500
ABC 08/22/16 00:00:00 600
ABC 08/23/16 00:00:00 650
ABC 08/24/16 00:00:00 625
ABC 08/25/16 00:00:00 675
ABC 08/26/16 00:00:00 680
然后,我有以下内容强制执行'日期'列成日期时间格式:
df['Date'] = pd.to_datetime(df['Date'], errors = 'coerce')
有趣的是,我看到" pandas.core.series.Series
"当我打电话给你时:
type(df['Date'])
最后,我打电话给以下人员创建一个情节:
%matplotlib qt
sns.tsplot(df['Value'])
在从左到右的x轴上,我看到从0到数据帧中的行数的整数。如何添加'日期'列作为此图的x轴值?
谢谢!
答案 0 :(得分:6)
不确定tsplot是最好的工具。你可以使用:
df[['Date','Value']].set_index('Date').plot()
答案 1 :(得分:2)
使用time
tsplot
参数
来自docs:
time : string or series-like
Either the name of the field corresponding to time in the data DataFrame or x values for a plot when data is an array. If a Series, the name will be used to label the x axis.
#Plot the Value column against Date column
sns.tsplot(data = df['Value'], time = df['Date'])
但是tsplot
用于在同一时间窗口和不同条件下绘制时间序列。要绘制单个时间序列,您还可以使用plt.plot(time = df['Date'], data = df['Value'])
答案 2 :(得分:0)
我认为为时已晚。
首先,您必须注意“日期”列是一系列“日期时间”类型,因此您应该这样做以获取“日期”部分:
df['Date'] = df['Date'].map(lambda x:x.date())
现在按“日期”对数据框进行分组,然后重置索引以使“日期”成为列(而不是索引)。
然后您可以使用 plt.plot_date
df_groupedby_date = df.groupby('Date').count()
df_groupedby_date.reset_index(inplace=True)
plt.plot_date(x=df_groupedby_date['Date'], y=df_groupedby_date['Value'])