如何使用sklearn在python中查找缺失值

时间:2019-01-25 04:02:21

标签: python pandas numpy scikit-learn

我想通过数据集中的均值方法计算mssing值,但是它给了我

  

无法散列的错误类型:“切片”


代码:

import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
dataset= pd.read_csv('Data.csv')
m=dataset.iloc[:,:-1].values
X= pd.DataFrame(m)
n=dataset.iloc[:,-1].values
Y= pd.DataFrame(n)

from sklearn.preprocessing import Imputer
imputer = Imputer(missing_values = 'NaN', strategy = 'mean', axis = 0)
imputer = imputer.fit(X[:, 1:3])
X[:, 1:3] = imputer.transform(X[:, 1:3])

1 个答案:

答案 0 :(得分:0)

不能切片如下所示的DataFrame

 `'X[:,1:3]'`.

您应该使用'iloc'进行切片,或者使用'values'进行另一种切分

  'X.iloc[:,1:3]'

  'X.values[:,1:3]'