Question

使用单索引数据帧，我可以执行以下操作：

df2 = DataFrame(data={'data': [1,2,3]}, 
                index=Index([dt(2016,1,1),
                      dt(2016,1,2),
                      dt(2016,2,1)]))

>>> df2['2016-01 : '2016-01']
                data
    2016-01-01     1
    2016-01-02     2

>>> df2['2016-01-01' : '2016-01-01']
                data
    2016-01-01     1

当您给它一整天（即2016-01-01）时，日期时间切片有效，当您给它一个部分日期时，它也有效，例如年和月（2016-01）。所有这些都很有效，但是当您引入多索引时，它仅适用于完整日期。部分日期切片似乎不再起作用了

df = DataFrame(data={'data': [1, 2, 3]},
               index=MultiIndex.from_tuples([(dt(2016, 1, 1), 2),
                                             (dt(2016, 1, 1), 3),
                                             (dt(2016, 1, 2), 2)],
                                             names=['date', 'val']))


 >>> df['2016-01-01 : '2016-01-02']
                            data
     date       val     
     2016-01-01 2           1
                3           2
     2016-01-02 2           3

好的，没关系，但部分日期：

>>> df['2016-01' : '2016-01']
 File "pandas/index.pyx", line 134, in pandas.index.IndexEngine.get_loc      (pandas/index.c:3824)
 File "pandas/index.pyx", line 154, in pandas.index.IndexEngine.get_loc (pandas/index.c:3704)
 File "pandas/hashtable.pyx", line 686, in pandas.hashtable.PyObjectHashTable.get_item (pandas/hashtable.c:12280)
 File "pandas/hashtable.pyx", line 694, in pandas.hashtable.PyObjectHashTable.get_item (pandas/hashtable.c:12231)
  KeyError: '2016-01'

（我缩短了追溯）。

知道这是否可行？这是一个错误吗？有没有办法做我想做的事情而不必诉诸于：

df.loc[(df.index.get_level_values('date') >= start_date) &
       (df.index.get_level_values('date') <= end_date)]

任何提示，评论，建议等都非常感谢！我尝试了很多其他的事情无济于事！

Answer 1

横截面应该有效：

df.xs(slice('2016-01-01', '2016-01-01'), level='date')

文档：http://pandas.pydata.org/pandas-docs/stable/generated/pandas.DataFrame.xs.html

Answer 2

使用pandas IndexSlice获得更加pandtastic的语法。

idx = pd.IndexSlice
df.loc[idx['2016-01-01':'2016-01-01', :], :])

请记住，pandas切片是左右包含的。

使用Index vs MultiIndex进行Pandas Dataframe日期时间切片

2 个答案: