处理具有不同开始日期的时间序列

时间:2019-09-25 09:04:24

标签: pandas time-series

我是Python新手,我遇到一个问题,希望您能为我提供帮助。

我在熊猫有两个时间序列,但是它们在不同的日期开始。假设一个开始于1989年,另一个开始于2002年。现在,我想比较这两个系列的累积增长,方法是将这两个系列的索引编制到2002年(我同时拥有这两个数据的第一个时间段),然后计算该比率。

最好的方法是什么?理想情况下,脚本应该检查一对序列的最早可用数据,并从该点开始将它们都索引为100。

先谢谢您!

1 个答案:

答案 0 :(得分:0)

一个实用的解决方案可能是将数据帧分为两列,每个时间序列一列,然后在每个数据帧中添加一个“ monthyear”列,该列仅列出月份和年份(例如05-2015)。然后,您可以在该月份变量的两个数据帧上使用pd.merge,只保留发生月份重叠的行。该函数为pd.merge(df1, df2, on='monthyear', how='inner')

您可以通过创建新的数据框并仅加载1列(或行,具体取决于数据框的外观)来拆分熊猫数据框。 df1 = pd.Dataframe(original_dataframe[0])df2 = pd.Dataframe(original_dataframe[1])