从多索引熊猫系列创建1列数据框

时间:2019-07-19 13:34:42

标签: python pandas series

我有一个这样的多索引系列:

Year  Month
2012  1        444
      2        222
      3        333
      4        1101
我想变成的

Date      Value
2012-01   444
2012-02   222
2012-03   333
2012-04   1101

绘制一条线。

我同时尝试了series.unstack(level=0)series.unstack(level=1),但这会创建一个矩阵

In[1]: series.unstack(level=0)
Out[1]: 
Year   2012  2013  2014  2015  2016  2017   2018
Month                                          
1      444  ...   ...   ...   ...   ...    ...
2      222  ...   ...   ...   ...   ...    ...
3      333  ...   ...   ...   ...   ...    ...
4      1101 ...   ...   ...   ...   ...    ...

我想念什么?

2 个答案:

答案 0 :(得分:3)

如果还添加了Day列,则将Index.to_frameto_datetime一起使用,并重新分配:

s.index = pd.to_datetime(s.index.to_frame().assign(Day=1))
print (s)
2012-01-01     444
2012-02-01     222
2012-03-01     333
2012-04-01    1101
Name: a, dtype: int64

对于DataFrame的一列,请使用Series.to_frame

df1 = s.to_frame('Value')
print (df1)
            Value
2012-01-01    444
2012-02-01    222
2012-03-01    333
2012-04-01   1101

如果需要PeriodIndex,请添加Series.dt.to_period

s.index = pd.to_datetime(s.index.to_frame().assign(Day=1)).dt.to_period('m')
print (s)
2012-01     444
2012-02     222
2012-03     333
2012-04    1101
Freq: M, Name: a, dtype: int64

df2 = s.to_frame('Value')
print (df2)
         Value
2012-01    444
2012-02    222
2012-03    333
2012-04   1101

答案 1 :(得分:2)

idx = pd.PeriodIndex(
    year=s.index.get_level_values(0).tolist(), 
    month=s.index.get_level_values(1).tolist(), 
    freq='M', 
    name='Date'
)
s2 = pd.Series(s.values, index=idx, name=s.name)
s2.plot()

您还可以使用带有f字符串的列表理解来创建DatetimeIndex。

idx = pd.to_datetime([f'{year}-{month}' for year, month in s.index])