如何处理Python3中的缺失值?

时间:2018-01-11 11:39:42

标签: python-3.x data-science

A = ds.iloc[:,0:4].values
B = ds.iloc[:,-1].values

imp = Imputer(missing_values="NaN", strategy="mean", axis=0)
imp = impsqft.fit(A[:,3])
A[:,3] = imp.transform(A[:,3])

我想将第4列替换为该列的平均值以获取空值,但它给出了以下错误:

array=[  1.   2.  nan   4.   1.   2.   4.  nan   2.   3.].
Reshape your data either using array.reshape(-1, 1) if your data has a single feature or array.reshape(1, -1) if it contains a single sample.

1 个答案:

答案 0 :(得分:0)

Imputer类需要一个矩阵作为fit方法的输入。

您可以尝试使用reshape方法对其进行格式化,例如错误消息

mp = impsqft.fit(A[:,3].reshape(-1, 1))

或最简单的方法是传递矩阵而不是列表。

       A = ds.iloc[:,0:4]