忽略数据框中的NaN

时间:2017-06-21 16:40:41

标签: python pandas numpy dataframe

我想在数据框的列中找到具有缺失值的唯一元素。我试过这个:df[Column_name].unique()但是它返回nan作为其中一个元素。我该怎么做才能忽略缺失的值。 数据框看起来像这样。click here

1 个答案:

答案 0 :(得分:7)

在致电.dropna()之前,请尝试致电.unique()。一个工作的例子:

import pandas as pd
import numpy as np
df = pd.DataFrame({'col1': np.random.randint(0, 10, 12)})
df.loc[2] = np.nan
df.loc[5] = np.nan
df['col1'].unique()
### output: array([  4.,   0.,  nan,   8.,   1.,   3.,   2.,   6.])
df['col1'].dropna().unique()
### output: array([ 4.,  0.,  8.,  1.,  3.,  2.,  6.])