你如何在Pandas DataFrame中表示na?

时间:2014-12-06 00:42:49

标签: python pandas nan na

Pandas是否有相当于R的 na (意思是不可用)?如果不是,表示缺失值的约定是什么,而NaN代表数学上不可能的值,例如除以零?

3 个答案:

答案 0 :(得分:3)

目前Pandas或NumPy中没有NA值。来自"使用缺失数据"在Pandas手册(http://pandas.pydata.org/pandas-docs/stable/missing_data.html)中:

  

在内部使用NaN来表示缺失数据的选择主要是出于简单性和性能原因。它与MaskedArray方法不同,例如,scikits.timeseries。我们希望NumPy能够很快提供足够的本地NA类型解决方案(类似于R),以便在熊猫中使用。

此外,文档的这一部分(http://pandas.pydata.org/pandas-docs/stable/gotchas.html#nan-integer-na-values-and-na-type-promotions)提供了有关NA表示选择权衡的更多细节。

答案 1 :(得分:1)

它来自numpy

from numpy import nan
x = nan

答案 2 :(得分:1)

您可以在numpy

中使用它
import numpy as np
np.nan

或只是

float('NaN')

在pandas docs中,np.nan版本主要用于:http://pandas.pydata.org/pandas-docs/dev/missing_data.html