熊猫Multiindex系列级别重新索引

时间:2020-02-03 15:01:34

标签: python pandas multi-index reindex

我有一个带有2级MultiIndex的 ser_apl pandas.Series:

Date        Team     
2013-01-31  Man Utd      11
2013-02-28  Man Utd      12
2013-03-29  Man Utd      13
2013-04-30  Man Utd      14
2013-05-31  Man Utd      15
2013-06-28  Man Utd      16
2013-07-31  Man Utd      17
2013-08-30  Man Utd      18
2013-09-30  Man Utd      19
2013-10-31  Man Utd      20
2013-11-29  Man Utd      21
2013-12-31  Man Utd      22
2013-07-31  Liverpool    37
2013-08-30  Liverpool    38
2013-09-30  Liverpool    39
2013-10-31  Liverpool    40
2013-11-29  Liverpool    41
2013-12-31  Liverpool    42
2013-01-31  Chelsea      51
2013-02-28  Chelsea      52
2013-03-29  Chelsea      53
2013-04-30  Chelsea      54
2013-05-31  Chelsea      55
2013-06-28  Chelsea      56
Name: Result, dtype: int64

我需要为所有团队重新获得日期级别的索引:

Date        Team     
2013-01-31  Chelsea      51.0
2013-02-28  Chelsea      52.0
2013-03-29  Chelsea      53.0
2013-04-30  Chelsea      54.0
2013-05-31  Chelsea      55.0
2013-06-28  Chelsea      56.0
2013-07-31  Chelsea       NaN
2013-08-30  Chelsea       NaN
2013-09-30  Chelsea       NaN
2013-10-31  Chelsea       NaN
2013-11-29  Chelsea       NaN
2013-12-31  Chelsea       NaN
2013-01-31  Liverpool     NaN
2013-02-28  Liverpool     NaN
2013-03-29  Liverpool     NaN
2013-04-30  Liverpool     NaN
2013-05-31  Liverpool     NaN
2013-06-28  Liverpool     NaN
2013-07-31  Liverpool    37.0
2013-08-30  Liverpool    38.0
2013-09-30  Liverpool    39.0
2013-10-31  Liverpool    40.0
2013-11-29  Liverpool    41.0
2013-12-31  Liverpool    42.0
2013-01-31  Man Utd      11.0
2013-02-28  Man Utd      12.0
2013-03-29  Man Utd      13.0
2013-04-30  Man Utd      14.0
2013-05-31  Man Utd      15.0
2013-06-28  Man Utd      16.0
2013-07-31  Man Utd      17.0
2013-08-30  Man Utd      18.0
2013-09-30  Man Utd      19.0
2013-10-31  Man Utd      20.0
2013-11-29  Man Utd      21.0
2013-12-31  Man Utd      22.0
dtype: float64

首先,我准备了索引:

idx_level_date = ser_apl.index.get_level_values('Date').unique()

然后我尝试了几种方法:

ser_apl.reindex(idx_level_date, level = 'Date')

以及作为替代:

ser_apl.groupby('Team').apply(lambda iter_team: iter_team.reindex(idx_level_date, level = 'Date'))

两者均未成功: 结果与原始的ser_apl相同。

所以我需要重新索引的帮助。

P.S。我在这里找到了另一种拆堆技巧:Filling in date gaps in MultiIndex Pandas Dataframe

但是问题是为什么我不能用适当的方法做同样的事情?

1 个答案:

答案 0 :(得分:2)

通过MultiIndex.from_product创建所有可能的日期时间,并传递到Series.reindex,如有必要,通过Series.sort_index更改顺序:

mux = pd.MultiIndex.from_product(ser_apl.index.levels, names=ser_apl.index.names)
s = ser_apl.reindex(mux).sort_index(level=[1,0])

print (s)
Date        Team     
2013-01-31  Chelsea      51.0
2013-02-28  Chelsea      52.0
2013-03-29  Chelsea      53.0
2013-04-30  Chelsea      54.0
2013-05-31  Chelsea      55.0
2013-06-28  Chelsea      56.0
2013-07-31  Chelsea       NaN
2013-08-30  Chelsea       NaN
2013-09-30  Chelsea       NaN
2013-10-31  Chelsea       NaN
2013-11-29  Chelsea       NaN
2013-12-31  Chelsea       NaN
2013-01-31  Liverpool     NaN
2013-02-28  Liverpool     NaN
2013-03-29  Liverpool     NaN
2013-04-30  Liverpool     NaN
2013-05-31  Liverpool     NaN
2013-06-28  Liverpool     NaN
2013-07-31  Liverpool    37.0
2013-08-30  Liverpool    38.0
2013-09-30  Liverpool    39.0
2013-10-31  Liverpool    40.0
2013-11-29  Liverpool    41.0
2013-12-31  Liverpool    42.0
2013-01-31  Man Utd      11.0
2013-02-28  Man Utd      12.0
2013-03-29  Man Utd      13.0
2013-04-30  Man Utd      14.0
2013-05-31  Man Utd      15.0
2013-06-28  Man Utd      16.0
2013-07-31  Man Utd      17.0
2013-08-30  Man Utd      18.0
2013-09-30  Man Utd      19.0
2013-10-31  Man Utd      20.0
2013-11-29  Man Utd      21.0
2013-12-31  Man Utd      22.0
Name: Result, dtype: float64