我有一个包含332列的数据框。我想将值归结为能够使用scikit-learn的决策树分类器。我的问题是来自imputer函数的结果数据列只有330.
from sklearn.preprocessing import Imputer
imp = Imputer(missing_values='NaN', strategy='mean', axis=0)
cols = data.columns
new = imp.fit_transform(data)
print(data.shape,new.shape)
(34132, 332) (34132, 330)
答案 0 :(得分:3)