大熊猫数据框选择纳米索引

时间:2014-08-27 20:11:38

标签: python pandas

我的数据框df包含以下内容:

In [10]: df.index.unique()
Out[10]: array([u'DC', nan, u'BS', u'AB', u'OA'], dtype=object)

我可以轻松选择df.ix [" DC"],df.ix [" BS"]等。但我在选择{{时遇到问题1}}索引。

nan

如何选择df.ix[nan], df.ix["nan"], df.ix[np.nan] all won't work. 作为索引的行?

1 个答案:

答案 0 :(得分:15)

一种方法是使用df.index.isnull()来识别NaN的位置:

In [218]: df = pd.DataFrame({'Date': [0, 1, 2, 0, 1, 2], 'Name': ['A', 'B', 'C', 'A', 'B', 'C'], 'val': [0, 1, 2, 3, 4, 5]}, index=['DC', np.nan, 'BS', 'AB', 'OA', np.nan]); df
Out[218]: 
     Date Name  val
DC      0    A    0
NaN     1    B    1
BS      2    C    2
AB      0    A    3
OA      1    B    4
NaN     2    C    5

In [219]: df.index.isnull()
Out[219]: array([False,  True, False, False, False,  True], dtype=bool)

然后您可以使用df.loc选择这些行:

In [220]: df.loc[df.index.isnull()]
Out[220]: 
     Date Name  val
NaN     1    B    1
NaN     2    C    5

注意:我的原始答案使用的是pd.isnull(df.index),而不是Zero's suggestiondf.index.isnull()。最好使用df.index.isnull(),因为对于无法容纳NaN的索引类型,例如Int64IndexRangeIndexisnull方法returns an array of all False values immediately而不是盲目地检查索引中的每个项目的NaN值。