Python:如何在数据帧中使用sklearn函数?

时间:2019-01-22 13:58:40

标签: python arrays pandas dataframe

我有一个数据框X,其中包含40个城市的170个要素。我的目标变量y的格式为pandas.core.series.Series

X.shape
(170, 40)

type(y)
pandas.core.series.Series

y.shape
(170,)

我想尝试应用SelectKBest中的sklearn算法

from sklearn.feature_selection import SelectKBest
from sklearn.feature_selection import chi2

X_new = SelectKBest(chi2, k=2).fit_transform(X, y)

但是我遇到了以下错误

  

ValueError:未知标签类型:(数组([

1 个答案:

答案 0 :(得分:0)

根据Scikit-learn documentationy应该是一个numpy数组。尝试使用pandas.Series.values将此变量转换为类似numpy的arr:

y = y.values