Target-Variable的对数转换后的SelectKBest ValueError

时间:2018-09-05 12:38:17

标签: python scikit-learn feature-selection sklearn-pandas valueerror

我目前正在对Ames Iowa数据集中的房屋价格进行一些分析。 我已经成功整理了数据并删除了所有遗漏的值,等等,我将进行一些回归分析。我想构建三个回归模型,第一个具有两个最佳功能,第二个具有15个功能,第三个具有所有可用变量。我正在使用SelectKBest进行功能选择。我的目标变量是对数转换后的“ SalePrice”。 由于某些原因,我总是会从SelectKBest中收到一个价值错误。 有趣的是,如果我不对“ SalePrice”进行对数转换,则一切正常。 我按预期检查了目标变量的dtype和ist的浮点数。
有人可以帮我吗?
我真的很感激! enter image description here

1 个答案:

答案 0 :(得分:2)

您正在使用

SelectKBest(chi2)

根据documentation of chi2

参数:

X : {array-like, sparse matrix}, shape = (n_samples, n_features_in)
    Sample vectors.

y : array-like, shape = (n_samples,)
    Target vector (class labels).

chi2仅适用于分类任务,不适用于回归。您当前预测销售价格的问题是回归任务,因此是错误。

也许尝试用f_regression代替chi2