从列表中删除nan

时间:2017-08-15 14:47:19

标签: python nan

在尝试使用pandas进行项目时,我遇到了一个问题。我有一个nan值的列表,我无法将其删除。

我试过了:

incoms=data['int_income'].unique().tolist()
incoms.remove('nan')

但它不起作用:

  

list.remove(x):x不在列表中"

列表incoms如下:

[75000.0, 50000.0, 0.0, 200000.0, 100000.0, 25000.0, nan, 10000.0, 175000.0, 150000.0, 125000.0]

3 个答案:

答案 0 :(得分:7)

我认为您需要dropna才能删除NaN s:

incoms=data['int_income'].dropna().unique().tolist()
print (incoms)
[75000.0, 50000.0, 0.0, 200000.0, 100000.0, 25000.0, 10000.0, 175000.0, 150000.0, 125000.0]

如果所有值都只是整数:

incoms=data['int_income'].dropna().astype(int).unique().tolist()
print (incoms)
[75000, 50000, 0, 200000, 100000, 25000, 10000, 175000, 150000, 125000]

或者通过numpy.isnan选择所有非NaN值来删除NaN

a = data['int_income'].unique()
incoms= a[~np.isnan(a)].tolist()
print (incoms)
[75000.0, 50000.0, 0.0, 200000.0, 100000.0, 25000.0, 10000.0, 175000.0, 150000.0, 125000.0]
a = data['int_income'].unique()
incoms= a[~np.isnan(a)].astype(int).tolist()
print (incoms)
[75000, 50000, 0, 200000, 100000, 25000, 10000, 175000, 150000, 125000]

纯python解决方案 - 如果很大DataFrame则更慢:

incoms=[x for x in  list(set(data['int_income'])) if pd.notnull(x)]
print (incoms)
[0.0, 100000.0, 200000.0, 25000.0, 125000.0, 50000.0, 10000.0, 150000.0, 175000.0, 75000.0]
incoms=[int(x) for x in  list(set(data['int_income'])) if pd.notnull(x)]
print (incoms)
[0, 100000, 200000, 25000, 125000, 50000, 10000, 150000, 175000, 75000]

答案 1 :(得分:3)

你可以做的只是得到一个清理的清单,你不会把这些值转换成字符串后是'nan'。

代码如下:

incoms = [incom for incom in incoms if str(incom) != 'nan']

答案 2 :(得分:0)

在这种特定情况下,一种可能性是较早删除nan,以避免在列表中这样做:

incoms=data['int_income'].dropna().unique().tolist()