我特别在谈论Pandas版本0.11,因为我正忙着用.loc或.iloc替换我对.ix的使用。我喜欢这样一个事实,即区分.loc和.iloc会告诉我是打算按标签还是整数位置进行索引。我看到其中任何一个都会接受一个布尔数组,但我想保持它们的用法纯粹是为了清楚地传达我的意图。
答案 0 :(得分:5)
在11.0中,所有三种方法都有效,suggested in the docs只需使用df[mask]
。但是,这不是不在位置上完成,而是纯粹使用标签,所以在我看来loc
最能说明实际发生的事情。
更新:我在github上询问了这一点,结论是df.iloc[msk]
会给出NotImplementedError
(如果是整数索引掩码)或ValueError
(如果pandas 11.1
中的非整数索引)。
In [1]: df = pd.DataFrame(range(5), list('ABCDE'), columns=['a'])
In [2]: mask = (df.a%2 == 0)
In [3]: mask
Out[3]:
A True
B False
C True
D False
E True
Name: a, dtype: bool
In [4]: df[mask]
Out[4]:
a
A 0
C 2
E 4
In [5]: df.loc[mask]
Out[5]:
a
A 0
C 2
E 4
In [6]: df.iloc[mask] # Due to this question, this will give a ValueError (in 11.1)
Out[6]:
a
A 0
C 2
E 4
也许值得注意的是,如果你给了掩码整数索引,它会抛出一个错误:
mask.index = range(5)
df.iloc[mask] # or any of the others
IndexingError: Unalignable boolean Series key provided
这表明iloc实际上并未实现,它使用label,因此当我们尝试使用时,为什么11.1会抛出NotImplementedError
。
答案 1 :(得分:0)
我目前正在使用[]
,即__getitem__()
,例如
df = pd.DataFrame(dict(a=range(5)))
df[df.a%2==0]