pandas:使用.loc选择索引标签数组

时间:2013-11-07 19:31:50

标签: python pandas

考虑这个dataFrame:

df = pd.DataFrame({u'A': {2.0: 2.2,
  7.0: 1.4,
  8.0: 1.4,
  9.0: 2.2},  u'B': {2.0: 7.2,
  7.0: 6.3,
  8.0: 4.4,
  9.0: 5.0}})

看起来像这样:

      A       B
2    2.2     7.2
7    1.4     6.3
8    1.4     4.4
9    2.2     5.0

我想获得带有标签27的索引(数字,而不是字符串)

df.loc[[2, 7]]

给出错误!

IndexError: indices are out-of-bounds

但是,df.loc[7]df.loc[2]正常工作并且符合预期。另外,如果我用字符串而不是数字定义数据框索引:

df2 = pd.DataFrame({u'A': {'2': 2.2,
  '7': 1.4,
  '8': 1.4,
  '9': 2.2},
 u'B': {'2': 7.2,
  '7': 6.3,
  '8': 4.4,
  '9': 5.0}})

df2.loc[['2', '8']]

它工作正常。

这不是我期望df.loc的行为(这是一个错误还是只是一个问题?) 我可以将一组数字作为标签索引传递而不仅仅是位置吗?

我可以将所有索引转换为字符串,然后使用.loc进行操作,但对我的其余代码来说非常不方便。

谢谢你的时间!

1 个答案:

答案 0 :(得分:7)

这是0.12中的错误。版本0.13修复此问题(IOW,标签选择,当您传递列表时,数字或字符串是否应该起作用)。

可以这样做(尽管使用内部方法):

In [10]: df.iloc[df.index.get_indexer([2,7])]
Out[10]: 
     A    B
2  2.2  7.2
7  1.4  6.3