我目前正在对Ames Iowa数据集中的房屋价格进行一些分析。
我已经成功整理了数据并删除了所有遗漏的值,等等,我将进行一些回归分析。我想构建三个回归模型,第一个具有两个最佳功能,第二个具有15个功能,第三个具有所有可用变量。我正在使用SelectKBest进行功能选择。我的目标变量是对数转换后的“ SalePrice”。
由于某些原因,我总是会从SelectKBest中收到一个价值错误。
有趣的是,如果我不对“ SalePrice”进行对数转换,则一切正常。
我按预期检查了目标变量的dtype和ist的浮点数。
有人可以帮我吗?
我真的很感激!
答案 0 :(得分:2)
您正在使用
SelectKBest(chi2)
参数:
X : {array-like, sparse matrix}, shape = (n_samples, n_features_in) Sample vectors. y : array-like, shape = (n_samples,) Target vector (class labels).
chi2
仅适用于分类任务,不适用于回归。您当前预测销售价格的问题是回归任务,因此是错误。
也许尝试用f_regression
代替chi2