Question

我有一个csv文件并且有v3列，但该列有一些'nan'行。我怎么能除了行。

 dataset = pd.read_csv('mypath') 

    enc = LabelEncoder()
    enc.fit(dataset['v3'])
    print('fitting')
    dataset['v3'] = enc.transform(dataset['v3'])
    print('transforming')
    print(dataset['v3'])
    print('end')

编辑：V3列有A，C，B，A，C，D ,,, A，S，就像那样，我想把它转换成（1,2,3,1,2,4 ,, ，1,7）

Answer 1

使用~isnull（）掩盖nan值：

mask = ~dataset['v3'].isnull()
dataset['v3'][mask] = enc.fit_transform(dataset['v3'][mask])

另一种方法是使用pandas.factorize函数，该函数自动处理nans（将它们指定为-1）：

dataset['v3'] = dataset['v3'].factorize()[0]

python - TypeError：unorderable类型：str（）＆gt;浮动（）

1 个答案: