不良的输入形状Sklearn python

时间:2019-05-13 02:36:45

标签: python scikit-learn reshape

我正在尝试使用包含以下6000个实例(行)和700个特征(列)的数据训练模型。什么时候 f=Label_Target.transform(data.Target)中使用了fit(),它给出了重塑错误说明

  

“如果您的数据具有以下特征,请使用array.reshape(-1,1)重塑您的数据   单个特征或array.reshape(1,-1)(如果包含单个)   示例。”

但是如果我使用array.reshape(-1,1)重塑它,因为目标类只有一列,那么它会给我以下错误

  

“ ValueError:输入形状错误(4800,699)”。

要素数据集的形状为(6000,699),对于目标类,形状为(6000, 1)。如何解决?

from sklearn import svm, datasets 
from sklearn.model_selection import GridSearchCV
from sklearn import preprocessing 
from sklearn.preprocessing import LabelEncoder
import pandas as pd


data = pd.DataFrame.from_csv('data.csv') # 6000 instances and each instance is 700 samples (features)

data.head()
data.loc[:,"f1":"f699"]

#parameters={'kernel':('linear','rbf'),'C':[1]}#
parameters={'kernel':('linear','rbf'),'C':[1,10]}


svc = svm.SVC(gamma="scale")
clf = GridSearchCV(svc, parameters, cv=5)


Label_Target= preprocessing.LabelEncoder()
Label_Target.fit(data.Target)
f=Label_Target.transform(data.Target)

print(Label_Target.classes_)
f=f.reshape(-1,1)
print(f.shape)


clf.fit(f,data.loc[:,"f1":"f699"])
print( 'Best params: ', clf.best_params_)
print( 'Best score: ', clf.best_score_)

0 个答案:

没有答案