我正在尝试使用形状为(218,5)的标签上的形状为(218,1861)的TfIdfVectorizer转换数据进行多标签分类。
我得到
ValueError:输入形状错误(218,5)
我通过以下功能管道传递标签:
self.q_matrix = tf_idf.fit_transform(question_features)
y = MultiLabelBinarizer().fit_transform(tags)
clf.fit(self.q_matrix,y)
其中clf
是LinearSVC
。
答案 0 :(得分:0)
好像您要适合5个分类器(y
有5列)。您无法使用LinearSVC
来做到这一点。如您在fit函数的文档中所见,目标(y
)应该只有一列:
y:类似数组,形状= [n_samples]相对于X的目标矢量
因此,如果您要适合5个分类器(y
的每一列一个),则需要分别适合它们。