我该如何用战略“均值”来适应缺失的价值观?

时间:2019-05-01 11:34:55

标签: python machine-learning scikit-learn sklearn-pandas

我无法容纳缺失的值。我有两列具有NaN值。

  

ValueError:找到具有0个特征的数组(shape =(537577,0))而一个   至少需要1个。

import pandas as pd
import numpy as np
import matplotlib.pyplot as plt

veriler = pd.read_csv("BlackFriday.csv")
print(veriler)

from sklearn.preprocessing import Imputer

imputer=Imputer(missing_values="NaN", strategy="mean", axis=0)
pro2=veriler.iloc[:,9:11].values
print(pro2)

imputer=imputer.fit(pro2[:,9:11])
pro2[:,9:11]=imputer.transform(pro2[:,9:11])
print(pro2)

2 个答案:

答案 0 :(得分:2)

您已经使用iloc选择了想要的行 所以我认为您不必在pro2中再次使用它

尝试更改

imputer=imputer.fit(pro2[:,9:11])
pro2[:,9:11]=imputer.transform(pro2[:,9:11])
print(pro2)

imputer=imputer.fit(pro2)
pro2=imputer.transform(pro2)
print(pro2)

答案 1 :(得分:0)

您已经在pro2上进行了列切片。因此,不要再次索引!

尝试一下!

from sklearn.preprocessing import Imputer

imputer = Imputer(missing_values="NaN", strategy="mean", axis=0)

pro2 = veriler.iloc[:,9:11].values
pro2 = imputer.fit_transform(pro2)