所以我试图使用SVM将标题分类为描述。我的数据如下所示:
x_train = [
#hashingvectorizer
#string
#hashingvectorizer
]
y_train = #string
classifier = svm.SVC()
classifier.fit(x_train,y_train)
这给了我以下错误:ValueError: setting an array element with a sequence
我知道这是因为x_train
列表中的值与此相关的大小不同,但我不知道另一种方法。我如何重新组织我的数据或做一些事情,以便我可以拥有这种风格的多维数据?
x_train
中的数据如下所示:
[[
"this is a description that could be in any form, but not too large",
"title",
"tag1,tag2,tag3,tag4,tag5,...,tagn"],
[...],
[...]
]
<{1}}中的数据如下所示:
y_train
[[
"classified_group1",
"classified_group2",
#...
"classified_groupn"],
[...],
[...]
]