我有一个数据框X
,其中包含40
个城市的170
个要素。我的目标变量y
的格式为pandas.core.series.Series
X.shape
(170, 40)
type(y)
pandas.core.series.Series
y.shape
(170,)
我想尝试应用SelectKBest
中的sklearn
算法
from sklearn.feature_selection import SelectKBest
from sklearn.feature_selection import chi2
X_new = SelectKBest(chi2, k=2).fit_transform(X, y)
但是我遇到了以下错误
ValueError:未知标签类型:(数组([
答案 0 :(得分:0)
根据Scikit-learn documentation,y
应该是一个numpy数组。尝试使用pandas.Series.values将此变量转换为类似numpy的arr:
y = y.values