标签: numpy scipy scikit-learn sparse-matrix imputation
我正在使用scipy稀疏矩阵,用零填充缺失值。我想用相应列的平均值来估算这些缺失值,并计划使用Sklearn中的Imputer进行此操作。我的问题是,Imputer是否区分数据中的实际0值和填充0的缺失值?我知道numpy函数getnnz可以区分这些,但我希望Sklearn Imputer不会用列方法覆盖合法的零值。