我想我在大熊猫中对群体的理解缺少了一些东西。我的Dataframe已在'Date'上编入索引,并且该框架有一个名为'Year'的列,其中2014-10-10是2014,等等。
关键是我想将第1年数据与第2年数据相关联,依此类推。我应该对索引值列表做些什么?
我的意见是:
Date Adj Close Year
2013-Dec-31 0.16 2013
2013-Dec-30 0.13 2013
2013-Dec-27 0.11 2013
2012-Dec-31 0.1 2012
2012-Dec-28 0.1 2012
2012-Dec-27 0.1 2012
2012-Dec-26 0.1 2012
要进行相关,它们必须是并排框架吗?
Date Adj Close Year Date Adj Close Year
2012-Dec-31 0.1 2012 2013-Dec-31 0.16 2013
2012-Dec-28 0.1 2012 2013-Dec-30 0.13 2013
2012-Dec-27 0.1 2012 2013-Dec-27 0.11 2013
我是否必须为每个年度组创建一个新的数据框并合并它们?
答案 0 :(得分:0)
没有合并要做。您的所有数据都是针对特定日期的,只是" stack"彼此背后的数据,然后确保按月,日分组以获得年度相关性(同一天)
只需确保你的索引是一个合适的时间序列,然后pandas将为你做所有的魔术。也就是说,请查看手册中的this和this。如果您的索引是时间序列,那么使用索引来加权/计算距离的任何函数都会自动为您正确执行此操作。
在这里,我将再次从documentation
为您绘制自相关图df = pd.read_clipboard()
df.index = pd.DatetimeIndex(df.Date)
from pandas.tools.plotting import autocorrelation_plot
autocorrelation_plot(df['Adj')
,输出
如果您想使用此索引应用其他过滤,您甚至可以使用df['2013']
选择特定年份。