在熊猫MultiIndex DataFrame上建立索引时出现KeyError

时间:2019-01-08 10:00:49

标签: python pandas dataframe multi-index

文档中的以下示例按预期工作:

s = pd.Series([1, 2, 3, 4, 5, 6],index=pd.MultiIndex.from_product([["A", "B"], ["c", "d", "e"]]))

s['A']

c    1
d    2
e    3

但是,对于本示例,从我的数据来看,这样的索引会引发错误:

df = pd.DataFrame({'client_id': {('foo', '2018-01-29'): '1',
  ('bar', '2018-01-29'): '1',
  ('baz', '2018-01-29'): '1',
  ('alice', '2018-01-29'): '1',
  ('bob', '2018-01-29'): '1'}})

df['alice']

KeyError: 'alice'

我在做什么错了?

1 个答案:

答案 0 :(得分:1)

只需使用loc

df.loc['alice']

           client_id
2018-01-29         1

对于熊猫来说,尚不清楚{alice“是否是df的一列。对于该系列,很明显,对__getitem__的调用正在访问索引。


其他替代方法(根据How do I slice or filter MultiIndex DataFrame levels?):

df.loc(axis=0)['alice']

           client_id
2018-01-29         1

df.xs('alice')

           client_id
2018-01-29         1

df.query('ilevel_0 == "alice"')

                 client_id
alice 2018-01-29         1