我的数据框
下面的数据框由“年”,“月”和“数据”组成:
np.random.seed(0)
df = pd.DataFrame(dict(
Year = [2001, 2001, 2001, 2001, 2001, 2001, 2001, 2001, 2001, 2001, 2001, 2001, 2002, 2002, 2002, 2002, 2002, 2002, 2002, 2002, 2002, 2002, 2002, 2002, 2003, 2003, 2003, 2003, 2003, 2003, 2003, 2003, 2003, 2003, 2003, 2003],
Month = [1, 2, 3, 4, 5, 6, 7, 8, 9,10, 11, 12, 1, 2, 3, 4, 5, 6, 7, 8, 9,10, 11, 12, 1, 2, 3, 4, 5, 6, 7, 8, 9,10, 11, 12],
Data = np.random.randint(21,100,size=36)))
df
我想以一种Python方式将其转换为时间序列数据,以便将“ Data”和“ Data”作为时间序列数据而不是数据帧放置在适当位置。
我尝试过的事情
我尝试过:
import pandas as pd
timeseries = data.assign(Date=pd.to_datetime(data[['Year', 'Month']].assign(day=1)))
columns = ['Year','Month']
df.drop(columns,inplace = True,axis = 1)#我不需要日,但是年和月 时间序列
但是新数据只会在数据框中添加一个称为“日期”的列。
我想要的
我想要一个仅由“日期”(例如2001-1)和“数据”列组成的时间序列数据,以便我可以绘制时间图,对数据进行时间序列分析和预测。
我的意思是如何索引这样的时间序列数据,以便当我用以下代码绘制时:
plt.figure(figsize=(5.5, 5.5))
data1['Data'].plot(color='b')
plt.title('Monthly Data')
plt.xlabel('Data')
plt.ylabel('Data')
plt.xticks(rotation=30)
我将把x轴的刻度作为数据而不是数字