如何解决多标签分类的不良输入形状

时间:2018-12-31 03:17:36

标签: python-3.x scikit-learn svm multilabel-classification

我正在尝试使用形状为(218,5)的标签上的形状为(218,1861)的TfIdfVectorizer转换数据进行多标签分类。

我得到

  

ValueError:输入形状错误(218,5)

我通过以下功能管道传递标签:

self.q_matrix = tf_idf.fit_transform(question_features)

y = MultiLabelBinarizer().fit_transform(tags)

clf.fit(self.q_matrix,y)

其中clfLinearSVC

1 个答案:

答案 0 :(得分:0)

好像您要适合5个分类器(y有5列)。您无法使用LinearSVC来做到这一点。如您在fit函数的文档中所见,目标(y)应该只有一列:

  

y:类似数组,形状= [n_samples]相对于X的目标矢量

因此,如果您要适合5个分类器(y的每一列一个),则需要分别适合它们。