我想在数据框的列中找到具有缺失值的唯一元素。我试过这个:df[Column_name].unique()
但是它返回nan作为其中一个元素。我该怎么做才能忽略缺失的值。
数据框看起来像这样。click here
答案 0 :(得分:7)
在致电.dropna()
之前,请尝试致电.unique()
。一个工作的例子:
import pandas as pd
import numpy as np
df = pd.DataFrame({'col1': np.random.randint(0, 10, 12)})
df.loc[2] = np.nan
df.loc[5] = np.nan
df['col1'].unique()
### output: array([ 4., 0., nan, 8., 1., 3., 2., 6.])
df['col1'].dropna().unique()
### output: array([ 4., 0., 8., 1., 3., 2., 6.])