pandas - 处理具有不同开始日期的时间序列

处理具有不同开始日期的时间序列

时间：2019-09-25 09:04:24

标签： pandas time-series

我是Python新手，我遇到一个问题，希望您能为我提供帮助。

我在熊猫有两个时间序列，但是它们在不同的日期开始。假设一个开始于1989年，另一个开始于2002年。现在，我想比较这两个系列的累积增长，方法是将这两个系列的索引编制到2002年（我同时拥有这两个数据的第一个时间段），然后计算该比率。

最好的方法是什么？理想情况下，脚本应该检查一对序列的最早可用数据，并从该点开始将它们都索引为100。

先谢谢您！

1 个答案:

答案 0 :(得分：0)

一个实用的解决方案可能是将数据帧分为两列，每个时间序列一列，然后在每个数据帧中添加一个“ monthyear”列，该列仅列出月份和年份（例如05-2015）。然后，您可以在该月份变量的两个数据帧上使用pd.merge，只保留发生月份重叠的行。该函数为pd.merge(df1, df2, on='monthyear', how='inner')

您可以通过创建新的数据框并仅加载1列（或行，具体取决于数据框的外观）来拆分熊猫数据框。 df1 = pd.Dataframe(original_dataframe[0])和df2 = pd.Dataframe(original_dataframe[1])