根据特定列或列

时间:2016-04-24 07:45:07

标签: python pandas

我有一个导入的xls文件作为pandas dataframe,有两列包含坐标,我将使用这些坐标将数据框与其他具有地理定位数据的数据框合并。 df.info()显示8859条记录,坐标列有'8835非null float64'记录。

我想通过所有列记录来观察24行(我假设为空)以查看是否有其他列(街道地址镇)不能用于手动添加这24条记录的坐标。 IE浏览器。返回df。['Easting']中列的数据帧,其中isnull或NaN

我已经调整了here给出的方法,如下所示;

df.loc[df['Easting'] == NaN]

但是回到一个空的数据帧(0行×24列),这对我来说毫无意义。尝试使用Null或Non null不起作用,因为未定义这些值。我错过了什么?

1 个答案:

答案 0 :(得分:5)

我认为您需要isnull才能使用boolean indexing检查NaN值:

df[df['Easting'].isnull()]

Docs

  

警告

     

必须要注意的是,在python(和numpy)中,nan的比较并不相同,但是没有。请注意,Pandas / numpy使用np.nan!= np.nan的事实,并像np.nan一样对待None。

In [11]: None == None
Out[11]: True

In [12]: np.nan == np.nan
Out[12]: False
  

因此,与上述相比,标量相等比较与None / np.nan无法提供有用的信息。

In [13]: df2['one'] == np.nan
Out[13]: 
a    False
b    False
c    False
d    False
e    False
f    False
g    False
h    False
Name: one, dtype: bool