Python多维x_train scikit-learn

时间:2014-07-25 14:40:52

标签: python numpy scikit-learn

所以我试图使用SVM将标题分类为描述。我的数据如下所示:

x_train = [
    #hashingvectorizer
    #string
    #hashingvectorizer
]
y_train = #string

classifier = svm.SVC()
classifier.fit(x_train,y_train)

这给了我以下错误:ValueError: setting an array element with a sequence

我知道这是因为x_train列表中的值与此相关的大小不同,但我不知道另一种方法。我如何重新组织我的数据或做一些事情,以便我可以拥有这种风格的多维数据?

数据示例:

向量化之前的x_train中的

数据如下所示:

[[
    "this is a description that could be in any form, but not too large",
    "title",
    "tag1,tag2,tag3,tag4,tag5,...,tagn"],
 [...],
 [...]
]
<{1}}中的

数据如下所示:

y_train

完全追溯

[[
    "classified_group1",
    "classified_group2",
     #...
    "classified_groupn"],
 [...],
 [...]
]

0 个答案:

没有答案