我正在尝试将xls文件中的缺失数据转换为Nan值的数据框。
New list=energy.where(energy['Energy Supply']>=0)
我知道了
运算符> =不能在字符串和整数之间使用。
除了丢失的数据,我的数据类型是数字。
答案 0 :(得分:0)
您需要使用.loc
进行索引:
energy.loc[energy['Energy Supply']>=0,:]
使用:
显示所有列是可选的。以下也应该起作用:
energy.loc[energy['Energy Supply']>=0]
以上将不包含任何缺失值。
要检测字符串,请使用:
energy['Energy Supply'].apply(lambda x: False if isinstance(x,str) else x>=0)
要用NaN替换所有字符串:
energy['Energy Supply'].loc[energy['Energy Supply'].apply(lambda x: isinstance(x, str))] = numpy.nan
此外,Python中不使用New
关键字。
另一方面,由于list
是Python中的关键字,因此不应将其用作变量。使用lst
或mylist
等。