如何将丢失的数据转换为NaN值

时间:2018-12-23 11:40:47

标签: python pandas

我正在尝试将xls文件中的缺失数据转换为Nan值的数据框。

New list=energy.where(energy['Energy Supply']>=0)

我知道了

  

运算符> =不能在字符串和整数之间使用。

除了丢失的数据,我的数据类型是数字。

1 个答案:

答案 0 :(得分:0)

您需要使用.loc进行索引:

energy.loc[energy['Energy Supply']>=0,:]

使用:显示所有列是可选的。以下也应该起作用:

energy.loc[energy['Energy Supply']>=0]

以上将不包含任何缺失值。

要检测字符串,请使用:

energy['Energy Supply'].apply(lambda x: False if isinstance(x,str) else x>=0)

要用NaN替换所有字符串:

energy['Energy Supply'].loc[energy['Energy Supply'].apply(lambda x: isinstance(x, str))] = numpy.nan

此外,Python中不使用New关键字。

另一方面,由于list是Python中的关键字,因此不应将其用作变量。使用lstmylist等。