在pandas数据框中设置两列作为时间序列分析的索引

时间:2016-02-11 05:04:24

标签: python pandas indexing time-series

在天气或股票市场数据的情况下,温度和股票价格都是在多个站点或股票代码测量任何给定日期。

因此,设置包含两个字段的索引的最有效方法是什么?

天气:weather_station,然后是Date

对于股票数据:stock_code,然后是Date

以这种方式设置索引将允许过滤,例如:

  • stock_df["code"]["start_date":"end_date"]
  • weather_df["station"]["start_date":"end_date"]

2 个答案:

答案 0 :(得分:3)

如Anton所述,您需要使用MultiIndex,如下所示:

stock_df.index = pd.MultiIndex.from_arrays(stock_df[['code', 'date']].values.T, names=['idx1', 'idx2'])

weather_df.index = pd.MultiIndex.from_arrays(weather_df[['station', 'date']].values.T, names=['idx1', 'idx2'])

答案 1 :(得分:0)

目前存在该功能。有关更多示例,请参阅documentation

[
 "password": <password>, 
 "grant_type": password, 
 "username": <username>
]